Mysql逗号拼接字符串的关联查询以及统计问题

吾爱主题 阅读:176 2023-03-05 15:42:00 评论:0

背景:

数据库中逗号拼接的字符串,想展示其完整拼接名称或者按其值统计处理,怎么做?

FIND_IN_SET函数和GROUP_CONCAT函数你会用吗?

一、查询问题

eg两张表 t_conclusion_detail(拜访信息表) 和 t_conclusion_info(拜访结论表)

t_conclusion_detail:

id userName conclusionIds
781918060586991616 梦琪 1,3
781986564770103296 西施 3
781989822074978304 火舞 2,3,4

t_conclusion_info:

conclusionId conclusionName
1 已成交
2 暂无兴趣
3 需要跟进
4 沟通顺利

想要的效果:

id userName conclusionIds conclusionNameStr
781918060586991616 梦琪 1,3 已成交,需要跟进
781986564770103296 西施 3 需要跟进
781989822074978304 火舞 2,3,4 暂无兴趣,需要跟进,沟通顺利

思考:

一般这种情况两种方案:要么代码层面处理,要么数据库层面处理

1、方案一( 代码层面):先查拜访信息表,将数据返回到服务器,在代码里进行切割,然后再去拜访结论表里面去查询对应的名称,返回到程序进行处理拼接。造成频繁访问数据库,或需要批量查回再匹配处理,这样做虽然很简单也很好理解但是效率太低。

2、方案二(数据库):以mysql为例,使用FIND_IN_SET函数和GROUP_CONCAT函数进行查询,但是数据量特别大时可能不友好,利用不上索引等

?
1 2 3 4 5 6 SELECT s.id,s.user_name userName,s.conclusion_ids conclusionIds, ( SELECT GROUP_CONCAT(user_name) FROM t_conclusion_info tr WHERE FIND_IN_SET(tr.conclusion_id,( SELECT conclusion_ids FROM t_conclusion_detail WHERE id=s.id))) AS conclusionNameStr FROM t_conclusion_detail s

tip:如果数据量特别大建议还是设计时不要逗号拼接设计,改成多表联查,或者使用代码层面处理

二、统计问题

还是上述两张表,想要的效果是每个结论出现频次的统计,即统计逗号拼接的字符串中内容

伪代码,具体根据情况拼接业务sql:

?
1 2 3 4 5 6 SELECT sum ( case when find_in_set( '1' ,conclusion_ids)>0  then 1 else 0 end ) one, sum ( case when find_in_set( '2' ,conclusion_ids) >0 then 1 else 0 end ) two, sum ( case when find_in_set( '3' ,conclusion_ids) >0 then 1 else 0 end ) three, sum ( case when find_in_set( '4' ,conclusion_ids) >0 then 1 else 0 end ) four from t_conclusion_detail

结果:

one two three four
1 1 3 1

三、效率问题

思考: 模拟插入20万数据,查看find_in_set效率问题:

?
1 2 3 4 5 6 CREATE TABLE `t_conclusion_detail` (     `id` bigint unsigned NOT NULL AUTO_INCREMENT COMMENT '主键' ,     `user_name` varchar (32) COMMENT '姓名' ,     `conclusion_ids` varchar (32) COMMENT '拜访结论(多个结论逗号分隔)'    PRIMARY KEY (`id`)    ) ENGINE=InnoDB AUTO_INCREMENT=1 COMMENT= '拜访记录表' ;
?
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 DROP PROCEDURE IF EXISTS `t_conclusion_detail_memory`   DELIMITER // CREATE PROCEDURE `t_conclusion_detail_memory`( IN n INT ) BEGIN      DECLARE i INT DEFAULT 1;      DECLARE id INT DEFAULT 1;      DECLARE num1 INT DEFAULT 1;      DECLARE num2 INT DEFAULT 1;      DECLARE num3 INT DEFAULT 1;      WHILE i < n DO          SET id = i;          SET num1 = FLOOR(0 + RAND()*6);          SET num2 = FLOOR(0 + RAND()*6);          SET num3 = FLOOR(0 + RAND()*6);          INSERT INTO `t_conclusion_detail` VALUES (id, 'test' , concat(num1, ',' ,num2, ',' ,num3), );          SET i = i + 1;      END WHILE; END // DELIMITER ;  -- 改回默认的 MySQL delimiter:';'   CALL t_conclusion_detail_memory(200000);

经实验,20w数据时相关查询最慢2s左右,可接受范围。

总结

到此这篇关于Mysql逗号拼接字符串的关联查询以及统计问题的文章就介绍到这了,更多相关Mysql逗号拼接字符串查询内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!

原文链接:https://blog.csdn.net/weixin_47061482/article/details/127690069

可以去百度分享获取分享代码输入这里。
声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

【腾讯云】云服务器产品特惠热卖中
搜索
标签列表
    关注我们

    了解等多精彩内容