MySql 如何实现无则插入有则更新

吾爱主题阅读：256 2024-04-02 08:03:14 评论：0

摘要

某些场景会有这样的需求：无记录则插入，有记录则更新。例如：新增用户，以身份证号码作为唯一身份标识，插入时若先查询是否存在记录再决定插入还是更新，在高并发情况下必然存在问题。本文提供三种解决方案。

方案一加锁

无论通过synchronized锁、ReentranLock锁还是分布式锁，都可以解决该问题。缺点是，加锁会影响性能。方法二和三都是数据库层面解决方案，个人感觉比方法一好一些。

方案二 Unique和Replace Into … SELECT …

首先对唯一性的字段添加唯一索引ALTER TABLE tb_name ADD UNIQUE (col1、col2...)，，通过唯一索引即可保证数据的唯一性。

加入唯一索引后，通过INSERT INTO插入相同数据就会报错，此时需要使用REPLACE INTO插入数据，用法是一样的。通过REPLACE INTO插入数据时，若存在相同数据，会将之前的记录删除，再重新插入数据。缺点是，存在先删除再插入的过程，sql需要考虑全部数据列，不然会丢失部分列的数据。缺点是，建立唯一索引会影响插入效率。下面是具体的例子。

1 2 3 4 5 6 7 8 # 建立索引 ALTER TABLE user ADD UNIQUE (id_card); # 假设 user 表只有id, name ,id_card三个字段，且id字段自增。 # 现在需要插入 name =ly，id_card=142733的记录。 # 但是，若之前存在id_card=142733的记录，修改 name =ly即可。 REPLACE INTO user (id, name ,id_card) SELECT id, 'ly' ,142733 FROM user RIGHT JOIN ( SELECT 1) AS tab ON user .id_card = 142733;

通过RIGHT JOIN (SELECT 1)，若存在id_card=142733的记录，执行sql后会将原始id保存在临时的结果集中，随name和id_card一同插入。若不存在该记录，则将null作为id随name和id_card一同插入。最终实现

方案三通过预插入语句判断是否存在记录

通过预插入语句，尝试插入，判断修改的记录是否大于0，若大于0表示插入成功，若为0则表示记录已存在，需要执行更新操作。

1 2 3 4 5 6 # 预插入 INSERT INTO user ( name ,id_card) SELECT 'ly' ,142733 FROM DUAL WHERE NOT EXISTE ( SELECT id_card FROM user WHERE id_card = 142733) ; # 若预插入语句插入成功（修改记录数=1），则无需后续操作。否则执行更新操作。 UPDATE user SET name = 'ly' WHERE id_card = 142733;

通过NOT EXISTE条件，若存在id_card=142733的记录则伪表DUAL记录为空，预插入语句修改记录为0，此时需要执行更新操作。

若不存在id_card=142733的记录，则伪表DUAL记录为一行且内容是'ly',142733，预插入语句修改记录为1，此时不必执行更新语句。

Mysql批量插入更新性能优化

对于数据量较大的插入和更新，因io/cpu等性能瓶颈，会产生大量的时间消耗，目前主流的优化主要包括预编译、单条sql插入多条数据、事务插入等，下面详细介绍一下：

单条插入（Mybatis）

1 2	`INSERT` `INTO` `SYS_CITY (CITY_CODE, CITY_NAME, PROVINCE_NAME, ALIAS, ABBRE_PY)` `VALUES` `(${cityCode}, ${cityName}, ${provinceName}, ${alias}, ${abbrePy})`

单条预编译插入（Mybatis）

采用预编译可以节约mysql服务的解析时间，mytatis中就是采用#变量

1 2	`INSERT` `INTO` `SYS_CITY (CITY_CODE, CITY_NAME, PROVINCE_NAME, ALIAS, ABBRE_PY)` `VALUES` `(#{cityCode}, #{cityName}, #{provinceName}, #{alias}, #{abbrePy})`

单条sql插入多条数据

即是拼接sql，在一个sql中插入多条或更新多条数据。

1 2	`INSERT` `INTO` `SYS_CITY (CITY_CODE, CITY_NAME, PROVINCE_NAME, ALIAS, ABBRE_PY)` `VALUES` `(` `"cityCode1"` `,` `"cityName1"` `,` `"provinceName1"` `"alias1"` `,` `"abbrePy1"` `),(` `"cityCode2"` `,` `"cityName2"` `,` `"provinceName2"` `"alias2"` `,` `"abbrePy2"` `)`

快的原因

1、合并后日志量（MySQL的binlog和innodb的事务让日志）减少了，降低日志刷盘的数据量和频率，从而提高效率；

2、通过合并SQL语句，减少网络传输的IO；

3、通过合并SQL语句，减少SQL语句解析的次数；

注意事项

1、数据库sql长度是有限制，sql长度别溢出，会报错；

2、乱序插入时候速度超过innodb_buffer的容量，每次定位索引涉及较多的磁盘读写操作，性能下降较快；

事务插入

事务插入即在插入前开启事务，插入结束关闭事务进行提交即可。

快的原因

1、进行一个INSERT操作时，MySQL内部会建立一个事务，在事务内才进行真正插入处理操作。通过使用事务可以减少创建事务的消耗；

注意事项

1、事务不能过大，MySQL有innodb_log_buffer_size配置项，事务超出这个时，会刷磁盘，导致性能下降；

2、乱序插入时候速度超过innodb_buffer的容量，每次定位索引涉及较多的磁盘读写操作，性能下降较快；

测试结果

环境：i5-4200U 1.6GHZ，12G内存，固态硬盘

\	:单条插入:	:单条预编译:	:单条插入多条:	:事务插入:
1000	4600毫秒	3334毫秒	8毫秒	704毫秒
10000	27204毫秒	26249毫秒	2959毫秒	2959毫秒
100000	240954毫秒	254716毫秒	17286毫秒	20539毫秒

总结

采用合并sql+事务插入组合，效率最高，乱序插入时候速度超过innodb_buffer的容量，每次定位索引涉及较多的磁盘读写操作，性能下降较快；尽量采用非乱序方式即可。以上为个人经验，希望能给大家一个参考，也希望大家多多支持服务器之家。

原文链接：https://blog.csdn.net/weixin_38229356/article/details/82891540

可以去百度分享获取分享代码输入这里。

声明

1.本站遵循行业规范，任何转载的稿件都会明确标注作者和来源；2.本站的原创文章，请转载时务必注明文章作者和来源，不尊重原创的行为我们将追究责任；3.作者投稿可能会经我们编辑修改或补充。