GROUP BY(聚合)函数
本章论述了用于一组数值操作的 group (集合)函数。除非另作说明, group 函数会忽略 NULL 值。

假如你在一个不包含 ROUP BY子句的语句中使用一个 group函数 ,它相当于对所有行进行分组。

AVG([DISTINCT] expr) 
返回expr 的平均值。 DISTINCT 选项可用于返回 expr的不同值的平均值。

若找不到匹配的行,则AVG()返回 NULL 。

MySQL> SELECT student_name, AVG(test_score)

->        FROM student

->        GROUP BY student_name;

BIT_AND(expr) www.111cn.cn
返回expr中所有比特的 bitwise AND 。计算执行的精确度为64比特(BIGINT) 。

若找不到匹配的行,则这个函数返回 18446744073709551615 。(这是无符号 BIGINT 值,所有比特被设置为 1)。

BIT_OR(expr) 
返回expr 中所有比特的bitwise OR。计算执行的精确度为64比特(BIGINT) 。

若找不到匹配的行,则函数返回 0 。

BIT_XOR(expr) 
返回expr 中所有比特的bitwise XOR。计算执行的精确度为64比特(BIGINT) 。

若找不到匹配的行,则函数返回 0 。

COUNT(expr) 
返回SELECT语句检索到的行中非NULL值的数目。

若找不到匹配的行,则COUNT() 返回 0 。

mysql> SELECT student.student_name,COUNT(*)

->        FROM student,course

->        WHERE student.student_id=course.student_id

->        GROUP BY student_name;

COUNT(*) 的稍微不同之处在于,它返回检索行的数目, 不论其是否包含 NULL值。

SELECT 从一个表中检索,而不检索其它的列,并且没有 WHERE子句时, COUNT(*)被优化到最快的返回速度。例如:

mysql> SELECT COUNT(*) FROM student;

这个优化仅适用于 MyISAM表, 原因是这些表类型会储存一个函数返回记录的精确数量,而且非常容易访问。对于事务型的存储引擎(InnoDB, BDB), 存储一个精确行数的问题比较多,原因是可能会发生多重事物处理, 而每个都可能会对行数产生影响。

COUNT(DISTINCT expr,[expr...]) 
返回不同的非NULL值数目。

若找不到匹配的项,则COUNT(DISTINCT)返回 0 。

mysql> SELECT COUNT(DISTINCT results) FROM student;

在MySQL中, 你通过给定一个表达式列表而获取不包含NULL 不同表达式组合的数目。在标准 SQL中,你将必须在COUNT(DISTINCT ...)中连接所有表达式。

GROUP_CONCAT(expr)

这个方法不错 可以将 分组的字符串 以,连接起来 
该函数返回带有来自一个组的连接的非NULL值的字符串结果。其完整的语法如下所示:

GROUP_CONCAT([DISTINCT] expr [,expr ...]

[ORDER BY {unsigned_integer | col_name | expr}

[ASC | DESC] [,col_name ...]]

[SEPARATOR str_val])

mysql> SELECT student_name,

->     GROUP_CONCAT(test_score)

->     FROM student

->     GROUP BY student_name;

Or:

mysql> SELECT student_name,

->     GROUP_CONCAT(DISTINCT test_score

->               ORDER BY test_score DESC SEPARATOR ' ')

->     FROM student

->     GROUP BY student_name;

在MySQL中,你可以获取表达式组合的连接值。你可以使用DISTINCT删去重复值。假若你希望多结果值进行排序,则应该使用  ORDER BY子句。若要按相反顺序排列,将 DESC (递减) 关键词添加到你要用ORDER BY 子句进行排序的列名称中。默认顺序为升序;可使用ASC将其明确指定。   SEPARATOR 后面跟随应该被插入结果的值中间的字符串值。默认为逗号 (‘,’)。通过指定SEPARATOR '' ,你可以删除所有分隔符。

使用group_concat_max_len系统变量,你可以设置允许的最大长度。  程序中进行这项操作的语法如下,其中 val 是一个无符号整数:

SET [SESSION | GLOBAL] group_concat_max_len = val;

若已经设置了最大长度, 则结果被截至这个最大长度。

MIN([DISTINCT] expr), MAX([DISTINCT] expr) 
返回expr 的最小值和最大值。 MIN() 和 MAX() 的取值可以是一个字符串参数;在这些情况下, 它们返回最小或最大字符串值。请参见7.4.5节,“MySQL如何使用索引”。  DISTINCT关键词可以被用来查找expr 的不同值的最小或最大值,然而,这产生的结果与省略DISTINCT 的结果相同。

若找不到匹配的行,MIN()和MAX()返回 NULL 。

mysql> SELECT student_name, MIN(test_score), MAX(test_score)

->        FROM student

->        GROUP BY student_name;

对于MIN()、 MAX()和其它集合函数, MySQL当前按照它们的字符串值而非字符串在集合中的相关位置比较 ENUM和 SET 列。这同ORDER BY比较二者的方式有所不同。这一点应该在MySQL的未来版本中得到改善。

STD(expr) STDDEV(expr) 
返回expr 的总体标准偏差。这是标准 SQL 的延伸。这个函数的STDDEV() 形式用来提供和Oracle 的兼容性。可使用标准SQL函数 STDDEV_POP() 进行代替。

若找不到匹配的行,则这些函数返回 NULL 。

STDDEV_POP(expr) 
返回expr 的总体标准偏差(VAR_POP()的平方根)。你也可以使用  STD() 或STDDEV(), 它们具有相同的意义,然而不是标准的 SQL。

若找不到匹配的行,则STDDEV_POP()返回 NULL。

STDDEV_SAMP(expr) 
返回expr 的样本标准差 ( VAR_SAMP()的平方根)。

若找不到匹配的行,则STDDEV_SAMP() 返回 NULL 。

SUM([DISTINCT] expr) 
返回expr 的总数。 若返回集合中无任何行,则 SUM() 返回NULL。DISTINCT 关键词可用于 MySQL 5.1 中,求得expr 不同值的总和。

若找不到匹配的行,则SUM()返回 NULL。

VAR_POP(expr) 
返回expr 总体标准方差。它将行视为总体,而不是一个样本, 所以它将行数作为分母。你也可以使用 VARIANCE(),它具有相同的意义然而不是 标准的 SQL。

若找不到匹配的项,则VAR_POP()返回NULL。

VAR_SAMP(expr) 
返回expr 的样本方差。更确切的说,分母的数字是行数减去1。

若找不到匹配的行,则VAR_SAMP()返回NULL。

VARIANCE(expr) 
返回expr 的总体标准方差。这是标准SQL 的延伸。可使用标准SQL 函数 VAR_POP() 进行代替。

若找不到匹配的项,则VARIANCE()返回NULL。

05-11 22:34