update.where无索引导致MySQL死锁问题解决

吾爱主题 阅读:108 2022-12-01 16:46:00 评论:0

引言

随着我被拉入一个新的群聊“生产环境死锁问题排查解决”,打破了午后的悠然惬意,点开群聊秒送了一个648超级大礼包(业务不正常,死锁异常日志输出),领导怒斥并要求赶紧排除解决并总结经验,刚好我略懂略懂一点MySQL锁知识,这不得秀一下自己的实力

死锁的日志

既然死锁已经发生,也完全不要慌啊,按我说着做,一定能找到原因然后解决

触发下面这条命令获取到线索

?
1 SHOW ENGINE INNODB STATUS;

执行后你会得到一段让人看了有点迷迷的死锁日志,具体我们该怎么分析死锁,可以分成一下三步

  • 查看发生死锁的事务(一)信息(包括持有的锁,等待的锁)
  • 查看发生死锁的事务(二)信息(包括持有的锁,等待的锁)
  • 查看回滚的是事务(一)还是事务(二),做好异常业务恢复的方案
  • 根据mysql的加锁机制分析发生的死锁的原因

由于死锁日志过于长,下面的日志只截取部分有用的记录

?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 ------------------------ LATEST DETECTED DEADLOCK ------------------------ 2022-10-14 15:51:34 0x1a00 发生死锁的事务(一) *** (1) TRANSACTION : TRANSACTION 32828384, ACTIVE 0 sec fetching rows mysql tables in use 1, locked 1 LOCK WAIT 12 lock struct(s), heap size 1128, 285 row lock(s) MySQL thread id 26352, OS thread handle 8548, query id 987590925 WIN-6Q9NIAJLCDR 172.27.15.57 swgj updating 事务(一)导致死锁的sql update xxx       SET STATUS = '2' ,          DESCRIPTION = 'xxx' ,          MODIFY_TIME = '2022-10-14 15:51:35.707'       WHERE  BATCH_NO = 'xxx'          and SFSB = '1' 事务(一)持有的锁 *** (1) HOLDS THE LOCK(S): RECORD LOCKS space id 8575 page no 82 n bits 104 index PRIMARY of table `swgj`.`spgl_xmspsxblxxxxb` trx id 32828384 lock_mode X 事务(一)持有锁的数据记录信息 (supremum虚拟最大记录) Record lock, heap no 1 PHYSICAL RECORD: n_fields 1; compact format; info bits 0   0: len 8; hex 73757072656d756d; asc supremum;; 事务(一)持有锁的数据记录信息 (哪一行数据被锁了) Record lock, heap no 2 PHYSICAL RECORD: n_fields 29; compact format; info bits 0   0: len 30; hex 30663730333038302d313164662d346439642d626338662d393439333333; asc 0f703080-11df-4d9d-bc8f-949333; (total 36 bytes);   1: len 6; hex 0000015129e1; asc    Q) ;;   2: len 7; hex 010000402103cd; asc    @!  ;;   3: len 6; hex 313635303036; asc 165006;;   .....   ..... 事务(一)等待的锁 *** (1) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 8575 page no 37 n bits 112 index PRIMARY of table `swgj`.`spgl_xmspsxblxxxxb` trx id 32828384 lock_mode X waiting 事务(一)等待锁的数据记录信息 Record lock, heap no 45 PHYSICAL RECORD: n_fields 29; compact format; info bits 0   0: len 30; hex 32643736613832362d343763362d343861332d613038662d343539333061; asc 2d76a826-47c6-48a3-a08f-45930a; (total 36 bytes);   1: len 6; hex 000001f4ebdd; asc       ;;   2: len 7; hex 820000402b3c96; asc    @+< ;;   3: SQL NULL ;   .....   .....   发生死锁的事务(二)   *** (2) TRANSACTION : TRANSACTION 32828381, ACTIVE 5 sec inserting mysql tables in use 1, locked 1 LOCK WAIT 125 lock struct(s), heap size 24696, 137 row lock(s), undo log entries 724 MySQL thread id 26357, OS thread handle 12700, query id 987590958 WIN-6Q9NIAJLCDR 172.27.15.57 swgj update 事务(二)导致死锁的sql insert into xxx       ( ID, BATCH_NO, DFSJZJ,... )       values ( 'xxx' , 'xxx' , 'xxx' ) 事务(二)持有的锁 *** (2) HOLDS THE LOCK(S): RECORD LOCKS space id 8575 page no 37 n bits 112 index PRIMARY of table `swgj`.`spgl_xmspsxblxxxxb` trx id 32828381 lock_mode X locks rec but not gap 事务(二)持有锁的数据记录信息 Record lock, heap no 45 PHYSICAL RECORD: n_fields 29; compact format; info bits 0   0: len 30; hex 32643736613832362d343763362d343861332d613038662d343539333061; asc 2d76a826-47c6-48a3-a08f-45930a; (total 36 bytes);   1: len 6; hex 000001f4ebdd; asc       ;;   2: len 7; hex 820000402b3c96; asc    @+< ;;   3: SQL NULL ;   ...   ... 事务(二)等待的锁 *** (2) WAITING FOR THIS LOCK TO BE GRANTED: RECORD LOCKS space id 8575 page no 82 n bits 104 index PRIMARY of table `swgj`.`spgl_xmspsxblxxxxb` trx id 32828381 lock_mode X locks gap before rec insert intention waiting 事务(二)等待锁的数据记录信息 Record lock, heap no 3 PHYSICAL RECORD: n_fields 29; compact format; info bits 0   0: len 30; hex 30666435313133662d393462382d346636632d383362372d303463656536; asc 0fd5113f-94b8-4f6c-83b7-04cee6; (total 36 bytes);   1: len 6; hex 000001dbb470; asc      p;;   2: len 7; hex 020000013619a1; asc     6  ;;   3: len 6; hex 313636333830; asc 166380;;   ...   ...

分析日志

从数据库版本5.7、事务的隔离级别 REPEATABLE READ

官方文档明确指出在 REPEATABLE READ 隔离级别下,默认查询条件下是加 next-key locks (record locks + gap locks )gap locks,当查询条件使用了唯一索引时,只会对当前查询的唯一记录进行加锁,此时锁为 record locks

官方文档强势占位

MySQL 隔离级别

MySQL InnoDB 锁的类型

MySQL InnoDB 中不同 SQL 语句如何置锁

从死锁日志信息可以得出

  • 根据事务id大小可得出事务(二)32828381 比事务(一)32828384 先执行
  • 从日志中的 index PRIMARY 得出锁是加在主键索引上
  • 根据业务代码,事务(二)将执行 N 条同表插入 insert 语句,加上持有锁信息得出,事务(二)先插入了一条新数据A,并得到新数据A的行锁 Record Locks
  • 事务(一)执行 update 时直接阻塞,为什么呢,直接给出答案吧,因为这条 update 的查询条件是没有索引,导致需要所有的记录都要加 Record LocksGap Locks,接着由于事务(二)已经持有新数据A的行锁,导致无法上锁而阻塞等待
  • 事务(二)继续插入一条新数据B时获取 insert intention locks 阻塞等待,很显然,事务(一)抢先占有插入数据上下索引的 Gap Locks,死锁产生,MySQL提示错误,并回滚事务(二)让事务(一)提交

复盘

接下来我将用一个小例子来复现这次死锁现象

  • 建一个简单的表
?
1 2 3 4 5 6 7 8 9 10 11 CREATE TABLE `dead_lock` (    `id` varchar (10) NOT NULL ,    `batch_no` varchar (10) DEFAULT NULL ,    `status` varchar (1) DEFAULT NULL ,    PRIMARY KEY (`id`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4; INSERT INTO dead_lock (id,batch_no,status) VALUES       ( '10' , '1' , '1' ),       ( '20' , '20' , '1' ),       ( '30' , '30' , NULL ),       ( '32' , '32' , NULL );
  • 开始事务A进行插入数据,但先不提交
?
1 2 begin ; insert into dead_lock values ( '34' , '34' , null );

  • 开始新的事务B进行更新数据,此时你会发现该事务被阻塞
?
1 2 begin ; update dead_lock set status = '1' where batch_no = '20' ;

  • 在事务A里插入一条特殊的数据,id为11的数据,当然不在事务B的持有锁的范围插入数据是不会造成死锁
?
1 insert into dead_lock values ( '11' , '11' , null );

总结

MySQL 事务隔离级别 REPEATABLE READ 的情况下,对于 update,delete 等操作语句,查询条件尽量使用索引,减少锁的范围,提高写的并发量,避免不必要的死锁发生影响业务正常运行

这次死锁的说明就到这里,希望大家能看得懂并有所收获,不得不说有些知识我是略过了,大家可以自行查看官方文档补充了解,更多关于update where无索引MySQL死锁的资料请关注服务器之家其它相关文章!

原文链接:https://juejin.cn/post/7159944476423618591

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

【腾讯云】云服务器产品特惠热卖中
搜索
标签列表
    关注我们

    了解等多精彩内容