现在的位置: 首页 > 数据库 > 正文

MySQL高级特性之集合函数

2020年05月02日 数据库 ⁄ 共 3761字 ⁄ 字号 评论关闭

到现在为止,你只学习了如何根据特定的条件从表中取出一条或多条记录。但是,假如你想对一个表中的记录进行数据统计。例如,如果你想统计存储在表中的一次民意测验的投票结果。或者你想知道一个访问者在你的站点上平均花费了多少时间。要对表中的任何类型的数据进行统计,都需要使用集合函数。你可以统计记录数目,平均值,最小值,最大值,或者求和。当你使用一个集合函数时,它只返回一个数,该数值代表这几个统计值之一。


这些函数的最大特点就是经常和GROUP BY语句配合使用,需要注意的是集合函数不能和非分组的列混合使用。


行列计数


计算查询语句返回的记录行数


直接计算函数COUNT(*)的值,例如,计算pet表中猫的只数:


>SELECT count(*) FROM pet WHERE species=’cat’;


+----------+


| count(*) |


+----------+


|        2 |


+----------+


统计字段值的数目


例如,计算pet表中species列的数目:


mysql> SELECT count(species) FROM pet;


+----------------+


| count(species) |


+----------------+


|              9 |


+----------------+


如果相同的种类出现了不止一次,该种类将会被计算多次。如果你想知道种类为某个特定值的宠物有多少个,你可以使用WHERE子句,如下例所示:


mysql> SELECT COUNT(species) FROM pet WHERE species=cat ;


注意这条语句的结果:


+----------------+


| COUNT(species) |


+----------------+


|              2 |


+----------------+


这个例子返回种类为cat的作者的数目。如果这个名字在表pet中出现了两次,则次函数的返回值是2。 而且它和上面提到过的语句的结果是一致的:


SELECT count(*) FROM pet WHERE species=’cat’


实际上,这两条语句是等价的。


假如你想知道有多少不同种类的的宠物数目。你可以通过使用关键字DISTINCT来得到该数目。如下例所示:


mysql> SELECT COUNT(DISTINCT species) FROM pet;


+-------------------------+


| COUNT(DISTINCT species) |


+-------------------------+


|                       5 |


+-------------------------+


如果种类cat出现了不止一次,它将只被计算一次。关键字DISTINCT 决定了只有互不相同的值才被计算。


通常,当你使用COUNT()时,字段中的空值将被忽略。


另外,COUNT()函数通常和GROUP BY子句配合使用,例如可以这样返回每种宠物的数目:


mysql> SELECT species,count(*) FROM pet GROUP BY species;


+---------+----------+


| species | count(*) |


+---------+----------+


| bird    |        2 |


| cat     |        2 |


| dog     |        3 |


| hamster |        1 |


| snake   |        1 |


+---------+----------+


计算字段的平均值


需要计算这些值的平均值。使用函数AVG(),你可以返回一个字段中所有值的平均值。


假如你对你的站点进行一次较为复杂的民意调查。访问者可以在1到10之间投票,表示他们喜欢你站点的程度。你把投票结果保存在名为vote的INT型字段中。要计算你的用户投票的平均值,你需要使用函数AVG():


SELECT AVG(vote) FROM opinion


这个SELECT语句的返回值代表用户对你站点的平均喜欢程度。函数AVG()只能对数值型字段使用。这个函数在计算平均值时也忽略空值。


再给出一个实际例子,例如我们要计算pet表中每种动物年龄的平均值,那么使用AVG()函数和GROUP BY子句:


mysql> SELECT species,AVG(CURDATE()-birth) FROM pet GROUP BY species;


返回的结果为:


+---------+----------------------+


| species | AVG(CURDATE()-birth) |


+---------+----------------------+


| bird    |                34160 |


| cat     |              74959.5 |


| dog     |      112829.66666667 |


| hamster |                19890 |


| snake   |                49791 |


+---------+----------------------+


计算字段值的和


假设你的站点被用来出售某种商品,已经运行了两个月,是该计算赚了多少钱的时候了。假设有一个名为orders的表用来记录所有访问者的定购信息。要计算所有定购量的总和,你可以使用函数SUM():


SELECT SUM(purchase_amount) FROM orders


函数SUM()的返回值代表字段purchase_amount中所有值的总和。字段purchase_amount的数据类型也许是DECIMAL类型,但你也可以对其它数值型字段使用函数SUM()。


用一个不太恰当的例子说明,我们计算pet表中同种宠物的年龄的总和:


mysql> SELECT species,SUM(CURDATE()-birth) FROM pet GROUP BY species;


你可以查看结果,与前一个例子对照:


+---------+----------------------+


| species | SUM(CURDATE()-birth) |


+---------+----------------------+


| bird    |                68320 |


| cat     |               149919 |


| dog     |               338489 |


| hamster |                19890 |


| snake   |                49791 |


+---------+----------------------+


计算字段值的极值


求字段的极值,涉及两个函数MAX()和MIN()。


例如,还是pet表,你想知道最早的动物出生日期,由于日期最早就是最小,所以可以使用MIN()函数:


mysql> SELECT MIN(birth) FROM pet;


+------------+


| MIN(birth) |


+------------+


| 1989-05-13 |


+------------+


但是,你只知道了日期,还是无法知道是哪只宠物,你可能想到这样做:


SELECT name,MIN(birth) FROM pet;


但是,这是一个错误的SQL语句,因为集合函数不能和非分组的列混合使用,这里name列是没有分组的。所以,你无法同时得到name列的值和birth的极值。


MIN()函数同样可以与GROUP BY子句配合使用,例如,找出每种宠物中最早的出生日期:


mysql> SELECT species,MIN(birth) FROM pet GROUP BY species;


下面是令人满意的结果:


+---------+------------+


| species | MIN(birth) |


+---------+------------+


| bird    | 1997-12-09 |


| cat     | 1993-02-04 |


| dog     | 1989-05-13 |


| hamster | 1999-03-30 |


| snake   | 1996-04-29 |


+---------+------------+


另一方面,如果你想知道最近的出生日期,就是日期的最大值,你可以使用MAX()函数,如下例所示:


mysql> SELECT species,MAX(birth) FROM pet GROUP BY species;


+---------+------------+


| species | MAX(birth) |


+---------+------------+


| bird    | 1998-09-11 |


| cat     | 1994-03-17 |


| dog     | 1990-08-31 |


| hamster | 1999-03-30 |


| snake   | 1996-04-29 |


+---------+------------+


总结


在本节中,介绍了一些典型的集合函数的用法,包括计数、均值、极值和总和,这些都是SQL语言中非常常用的函数。


这些函数之所以称之为集合函数,是因为它们应用在多条记录中,所以集合函数最常见的用法就是与GROUP BY子句配合使用,最重要的是集合函数不能同未分组的列混合使用。

抱歉!评论已关闭.