MySQL中count(*)执行慢的解决方案

吾爱主题阅读：238 2024-04-01 23:26:00 评论：0

前言：

在开发工作中，经常需要计算一个表的行数，比如一个内容系统审核记录总数。这时候我们最先想到是一条 select count(*) from my_table;语句。但是，随着系统（表）中记录数越来越多，这条查询语句执行的也会越来越慢。难道MySQL不会单独记个总数，我们每次要查的时候直接读出来？

那么就通过这一篇来聊聊count(*)语句到底是怎样实现的，以及 MySQL为什么会这么实现。如果在开发应用中有这样的需求，业务设计上可以怎么去做。

一、 count(*) 的实现方式

1、实现方式比较

在不同的MySQL引擎中，count(*)有着不同的实现方式。

MyISAM 引擎把一个表的总行数存在了磁盘上，因此执行 count(*) 的时候会直接返回这个数，效率很高；
而 InnoDB 引擎执行 count(*) 的时候，需要把数据一行一行地从引擎里面读出来，然后累积计数。这样就比较麻烦了。

【注意】在这篇学习文章里，是没有where过滤条件的count(*)，如果加了where条件，使用MyISAM引擎的表返回结果也不会变的很快。

2、为什么InnoDB不像MyISAM一样，也把数字存起来

因为InnoDB引擎即使是在同一个时刻的多个查询，由于多版本并发控制（MVCC）的原因，InnoDB引擎表“应该返回多少行”也是不确定的。

在InnoDB引擎四个隔离级别（读未提交RU；读已提交RC；可重复读RR；可串行化Serializable）中，而MVCC只适用于RC和RR。
MVCC：Multi-Version Concurrency Control，就是在事务执行过程中加入“版本”这个概念、MVCC的实现：通过保存数据在某个时间点的快照来实现的。

假设表 test 中现在有 10000 条记录，我们设计了三个用户并行的会话。

会话 A 先启动事务并查询一次表的总行数；
会话 B 启动事务，插入一行后记录后，查询表的总行数；
会话 C 先启动一个单独的语句，插入一行记录后，查询表的总行数。

如果从上到下是按照时间顺序执行的，同一行语句是在同一时刻执行的。下图表为会话 A、B、C 的执行流程。

会话A	会话B	会话C
BEGIN;
SELECT COUNT(*) FROM `test`;
		INSERT INTO `test`(写入一行数据);
	BEGIN;
	INSERT INTO `test`( 写入一行数据);
SELECT COUNT(*) FROM `test`; （返回1000）	SELECT COUNT(*) FROM `test`; （（返回1002）	SELECT COUNT(*) FROM `test`; （（返回1001）

从上图表中可以看到，在最后一个时刻，三个会话会同时查询表 test 的总行数，但结果却不同。

这和 InnoDB 的事务设计有关，可重复读是它默认的隔离级别，在代码上就是通过多版本并发控制(MVCC)来实现的。每一行记录都要判断自己是否对这个会话可见，因此对于count(*) 请求来说，InnoDB 只好把数据一行一行地读出依次判断，可见的行才能够用于计算“基于这个查询”的表的总行数。

InnoDB 是索引组织表，主键索引树的叶子节点是数据，而普通索引树的叶子节点是主键值。所以，普通索引树比主键索引树小很多。对于 count(*) 这样的操作，遍历哪个索引树得到的结果逻辑上都是一样的。因此，MySQL 优化器会找到最小的那棵树来遍历。在保证逻辑正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一。

如果使用 show table status 命令，输出结果里面也有一个TABLE_ROWS 用于显示这个表当前有多少行，这个命令执行挺快的，那 TABLE_ROWS 能代替 count(*)么？

索引统计的值是通过采样来估算的。实际上，TABLE_ROWS 就是从这个采样估算得来的，因此它很不准。官方文档说误差可能达到 40% 到 50%。所以，show table status 命令显示的行数也不能直接使用。

3、小结

MyISAM 引擎表虽然 count(*) 很快，但是不支持事务；
show table status 命令虽然返回很快，但是不准确；
InnoDB 引擎表直接 count(*)会遍历全表，虽然结果准确，但会导致性能问题。

那么，回到本文章开头的问题，如果在一个页面经常要显示内容系统的操作记录总数，这样的话，我们只能自己计数。下面我们来看看有哪些计数方法，以及每种方法的优缺点有哪些。基本思路：自己找一个地方，把操作记录表的行数存起来。

二、计数方法

1、用缓存系统保存计数

对于更新很频繁的库来说，我们第一时间想到的是用缓存系统来保存。比如用 Redis 服务来保存这个表的总行数。这个表插入一行时， Redis 计数就加 1，删除一行时， Redis 计数就减 1。这种方式下，读和更新操作都很快，但缓存系统可能会丢失更新，导致数据错误。

Redis 的数据不能永久地留在内存里，所以你会找一个地方把这个值定期地持久化存储起来。但即使这样，仍然可能丢失更新。如果刚刚在数据表中插入了一行，Redis 中保存的值也加了 1，然后 Redis 异常重启了，重启后你要从存储 redis 数据的地方把这个值读回来，而刚刚加 1 的这个计数操作却丢失了。

这种情况也可以解决，如果Redis 异常重启以后，到数据库里面单独执行一次 count(*) 获取真实的行数，再把这个值写回到 Redis 里就可以了。异常重启毕竟不是经常出现的情况，这一次全表扫描的成本，还是可以接受的。但在应用中，将计数保存在缓存系统中，还不只是丢失更新的问题。这个值在逻辑上也是不精确的。，

注意是逻辑不准确。

你可以设想一下有这么一个页面，要显示操作记录的总数，同时还要显示最近操作的 50 条记录。那么，这个页面的逻辑就需要先到 Redis 里面取出计数，再到数据表里面取数据记录。

我们是这么定义不精确的：