详解 MySQL中count函数的正确使用方法

吾爱主题阅读：257 2024-04-01 23:51:19 评论：0

1. 描述

在MySQL中，当我们需要获取某张表中的总行数时，一般会选择使用下面的语句

1	`select` `count` `(*)` `from` `table` `;`

其实count函数中除了*还可以放其他参数，比如常数、主键id、字段，那么它们有什么区别？各自效率如何？我们应该使用哪种方式来获取表的行数呢？

当搞清楚count函数的运行原理后，相信上面几个问题的答案就会了然于胸。

2. 表结构

为了解决上述的问题，我创建了一张 user 表，它有两个字段：主键id和name，后者可以为null，建表语句如下。

1 2 3 4 5 CREATE TABLE ` user ` ( `id` int (11) NOT NULL AUTO_INCREMENT COMMENT '主键' , ` name ` varchar (255) DEFAULT NULL COMMENT '姓名' , PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8;

在该表中共有6000000条数据，前1000000条数据行的name字段为空，其余数据行name=id，使用存储过程造测试数据的代码如下

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 -- 使用存储过程造测试数据 delimiter;; create procedure idata() begin declare i int ; set i=1; while(i<=6000000)do insert into user values (i, i); set i=i+1; end while; end ;; delimiter; call idata(); -- 将前1000000条数据的name字段置为null update user set name = null where id<1000000;

3. 执行 SQL 语句及结果

为了区分count函数不同参数的区别，主要从执行时间和扫描行数这两方面来描述SQL的执行效率，同时还会从返回结果来描述`count函数的特性。

*符号 —— select count(*) from user;
常数—— select count(1) from user;
非空字段—— select count(id) from user;
可为空的字段—— select count(name) from user;

3.1 *符号

1 2 3 4 5 6 7 mysql> select count (*) from user ; + ----------+ | count (*) | + ----------+ | 6000000 | + ----------+ 1 row in set (0.76 sec)

遍历全表，不取值（优化后，必定不是null，不取值），累加计数，最终返回结果。

3.2 常数

1 2 3 4 5 6 7 mysql> select count (1) from user ; + ----------+ | count (1) | + ----------+ | 6000000 | + ----------+ 1 row in set (0.76 sec)

遍历全表，一行行取数据，将每一行赋值为1，判断到该字段不可为空，累加计数，最终返回结果。

3.3 非空字段

1 2 3 4 5 6 7 mysql> select count (id) from user ; + -----------+ | count (id) | + -----------+ | 6000000 | + -----------+ 1 row in set (0.85 sec)

遍历全表，一行行取数据（会选择最小的索引树来遍历，所以比相同情况下的count字段效率更高），取每行的主键id，判断到该字段不可为空，累加计数，最终返回结果。

3.4 可为空的字段

1 2 3 4 5 6 7 mysql> select count ( name ) from user ; + -------------+ | count ( name ) | + -------------+ | 5900001 | + -------------+ 1 row in set (0.93 sec)

若字段定义不为空：遍历全表，一行行取数据，取每行的该字段，判断到该字段不可为空，累加计数，最终返回结果。
若字段定义可为空：遍历全表，一行行取数据，取每行的该字段，判断到该字段可能是null，然后再判断该字段的值是否为null，不为null才累加计数，最终返回结果。
若该字段没有索引，将遍历主键索引树。

4. 执行结果分析

4.1 结果集

首先从结果集的角度来看，前三条 SQL 语句的目的是一样的——返回的是所有行数，而 count 函数的参数是普通字段且字段默认为 null 的时候，它返回的是该字段不为 null 的行数。

4.2 执行时间

从执行时间上来看的话，效率大致是count(可为空的字段) < count(非空字段) < count(常数) < count(*)。

5. 总结

count是一个聚合函数，对于返回的结果集，一行行地判断，如果count函数的参数不是NULL，累计值就加1，否则不加。最后返回累计值。