通过一分钟快速了解索引技巧
花1分钟时间,了解聚集索引,非聚集索引,联合索引,索引覆盖。
举例,业务场景,用户表,表结构为:
?1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 | t_user( uid primary key , login_name unique , passwd, login_time, age, … ); |
聚集索引(clustered index):聚集索引决定数据在磁盘上的物理排序,一个表只能有一个聚集索引,一般用primary key来约束。
举例:t_user场景中,uid上的索引。
非聚集索引(non-clustered index):它并不决定数据在磁盘上的物理排序,索引上只包含被建立索引的数据,以及一个行定位符row-locator,这个行定位符,可以理解为一个聚集索引物理排序的指针,通过这个指针,可以找到行数据。
举例,查找年轻MM的业务需求:
?1 | select uid from t_user where age > 18 and age < 26; |
age上建立的索引,就是非聚集索引。
联合索引:多个字段上建立的索引,能够加速复核查询条件的检索
举例,登录业务需求:
?1 2 3 | select uid, login_time from t_user where login_name=? and passwd=? |
可以建立(login_name, passwd)的联合索引。
联合索引能够满足最左侧查询需求,例如(a, b, c)三列的联合索引,能够加速a | (a, b) | (a, b, c) 三组查询需求。
这也就是为何不建立(passwd, login_name)这样联合索引的原因,业务上几乎没有passwd的单条件查询需求,而有很多login_name的单条件查询需求。
提问:
?1 2 3 | select uid, login_time from t_user where passwd=? and login_name=? |
能否命中(login_name, passwd)这个联合索引?
回答:可以,最左侧查询需求,并不是指SQL语句的写法必须满足索引的顺序(这是很多朋友的误解)
索引覆盖:被查询的列,数据能从索引中取得,而不用通过行定位符row-locator再到row上获取,即“被查询列要被所建的索引覆盖”,这能够加速查询速度。
举例,登录业务需求:
?1 2 3 | select uid, login_time from t_user where login_name=? and passwd=? |
可以建立(login_name, passwd, login_time)的联合索引,由于login_time已经建立在索引中了,被查询的uid和login_time就不用去row上获取数据了,从而加速查询。
末了多说一句,登录这个业务场景,login_name具备唯一性,建这个单列索引就好。
作业:
假设订单有三种状态:0已下单,1已支付,2已完成
业务需求,查询未完成的订单,哪个SQL更快呢?
?1 2 3 4 5 6 7 8 9 10 11 | select * from order where status!=2 select * from order where status=0 or status=1 select * from order where status IN (0,1) select * from order where status=0 union select * from order where stauts=1 |
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对服务器之家的支持。
原文链接:https://mp.weixin.qq.com/s/4W4iVOZHdMglk0F_Ikao7A
1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。