关于MySQL 大批量插入时如何过滤掉重复数据

吾爱主题阅读：179 2024-04-02 08:05:52 评论：0

一、发现问题

1 2 3 4 5 6 7 8 9 10 11 CREATE TABLE `animal` ( `id` int (11) NOT NULL AUTO_INCREMENT, ` name ` varchar (20) DEFAULT NULL , `age` int (11) DEFAULT NULL , PRIMARY KEY (`id`) ) ENGINE=InnoDB AUTO_INCREMENT=1 DEFAULT CHARSET=utf8 COLLATE =utf8_bin; INSERT INTO `pilipa_dds`.`student` (`id`, ` name `, `age`) VALUES ( '1' , 'cat' , '12' ); INSERT INTO `pilipa_dds`.`student` (`id`, ` name `, `age`) VALUES ( '2' , 'dog' , '13' ); INSERT INTO `pilipa_dds`.`student` (`id`, ` name `, `age`) VALUES ( '3' , 'camel' , '25' ); INSERT INTO `pilipa_dds`.`student` (`id`, ` name `, `age`) VALUES ( '4' , 'cat' , '32' ); INSERT INTO `pilipa_dds`.`student` (`id`, ` name `, `age`) VALUES ( '5' , 'dog' , '42' );

目标：我们要去掉name相同的数据。

先看看哪些数据重复了

1 2 3 4 5 6 7 SELECT name , count ( 1 ) FROM student GROUP BY NAME HAVING count ( 1 ) > 1;

输出：

name count(1) cat 2 dog 2

name为cat和dog的数据重复了，每个重复的数据有两条；

1	`Select` `*` `From` `表` `Where` `重复字段` `In` `(` `Select` `重复字段` `From` `表` `Group` `By` `重复字段` `Having` `Count` `(1)>1)`

二、删除全部重复数据，一条不留

直接删除会报错

1 2 3 4 5 6 7 8 9 10 11 12 DELETE FROM student WHERE NAME IN ( SELECT NAME FROM student GROUP BY NAME HAVING count ( 1 ) > 1)

报错：

1	`1093 - You can` `'t specify target table '` `student'` `for` `update` `in` `FROM` `clause,` `Time` `: 0.016000s`

原因是：更新这个表的同时又查询了这个表，查询这个表的同时又去更新了这个表，可以理解为死锁。mysql不支持这种更新查询同一张表的操作

解决办法：把要更新的几列数据查询出来做为一个第三方表，然后筛选更新。

1 2 3 4 5 6 7 8 9 DELETE FROM student WHERE NAME IN ( SELECT t. NAME FROM ( SELECT NAME FROM student GROUP BY NAME HAVING count ( 1 ) > 1 ) t)

三、删除表中删除重复数据，仅保留一条

在删除之前，我们可以先查一下，我们要删除的重复数据是啥样的

1 2 3 4 5 6 7 8 9 10 11 SELECT * FROM student WHERE id NOT IN ( SELECT t.id FROM ( SELECT MIN ( id ) AS id FROM student GROUP BY ` name ` ) t )

啥意思呢，就是先通过name分组，查出id最小的数据，这些数据就是我们要留下的火种，那么再查询出id不在这里面的，就是我们要删除的重复数据。

四、开始删除重复数据，仅留一条

很简单，刚才的select换成delete即可

1 2 3 4 5 6 7 8 9 10 DELETE FROM student WHERE id NOT IN ( SELECT t.id FROM ( SELECT MIN ( id ) AS id FROM student GROUP BY ` name ` ) t )