MySQL校对规则(COLLATION)的具体使用

吾爱主题阅读：248 2024-04-01 23:21:02 评论：0

简介

本文介绍MySQL的校对规则。

MySQL的校对规则

两个不同的字符集不能有相同的校对规则。
每个字符集有一个默认校对规则。例如：
- utf8mb4默认校对规则：utf8mb4_general_ci。
- utf8默认校对规则：utf8_general_ci。
存在校对规则命名约定：它们以其相关的字符集名开始，通常包括一个语言名，并且以_ci（大小写不敏感）、_cs（大小写敏感）或_bin（二进制，大小写敏感）结束。

校对规则列举

utf8mb4_general_ci
utf8mb4_unicode_ci
utf8mb4_general_cs
utf8mb4_bin

//不存在utf8_unicode_cs

查看校对规则

查看支持的校验规则

1 2 3 4 5 6 7 8 9 10 11 12 mysql> SHOW COLLATION like 'utf8%' ; + --------------------------+---------+-----+---------+----------+---------+ | Collation | Charset | Id | Default | Compiled | Sortlen | + --------------------------+---------+-----+---------+----------+---------+ | utf8_general_ci | utf8 | 33 | Yes | Yes | 1 | | utf8_bin | utf8 | 83 | | Yes | 1 | | utf8_unicode_ci | utf8 | 192 | | Yes | 8 | ... | utf8mb4_general_ci | utf8mb4 | 45 | Yes | Yes | 1 | | utf8mb4_bin | utf8mb4 | 46 | | Yes | 1 | | utf8mb4_unicode_ci | utf8mb4 | 224 | | Yes | 8 | | utf8mb4_icelandic_ci | utf8mb4 | 225 | | Yes | 8 |

查看本地的校验规则

修改校对规则

修改数据库配置后，不会对已经存在的表造成影响，如要生效需要修改特定列的排序规则。优先级：列>表>数据库>服务器。

对已存在的表修改

1 2 3 4 5 6 # 修改数据库: ALTER DATABASE database_name CHARACTER SET = utf8mb4 COLLATE = utf8mb4_bin; # 修改表: ALTER TABLE table_name CONVERT TO CHARACTER SET utf8mb4 COLLATE utf8mb4_bin; # 修改表字段: ALTER TABLE table_name CHANGE column_name column_name VARCHAR (191) CHARACTER SET utf8mb4 COLLATE utf8mb4_bin NOT NULL ;

创建表时指定

1 2 3 CREATE TABLE `T` ( ` name ` varchar (20) COLLATE utf8mb4_unicode_ci DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE =utf8mb4_unicode_ci

utf8_general_ci 与 utf8_unicode_ci区别

项	utf8mb4_unicode_ci	utf8mb4_general_ci	总结
准确性	基于标准的Unicode来排序和比较，能够在各种语言之间精确排序	没有实现Unicode排序规则，在遇到某些特殊语言或字符时，排序结果可能不是所期望的。	绝大多数情况下，特殊字符的顺序不需要那么精确。
性能	在特殊情况下，Unicode排序规则为了能够处理特殊字符的情况，实现了略微复杂的排序算法。	在比较和排序的时候更快	绝大多数情况下，不会发生此类复杂比较。