MySQL 排序规则简介

本文详细介绍了MySQL的排序规则,包括字符集与排序规则的关系、默认排序规则、查看与修改排序规则的方法,以及排序规则命名和后缀的含义。了解这些知识有助于深入理解MySQL中的字符比较和排序操作。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

在日常工作中,对于MySQL排序规则,很少关注,大部分时候都是直接使用字符集默认的排序规则,常常忽视了排序规则的细节问题,了解排序规则有助于更好的理解MySQL字符比较和排序相关的知识

简述

说起排序规则就离不开字符集,严格来说,排序规则是依赖于字符集的

字符集是用来定义MySQL存储不同字符的方式,而排序规则一般指对字符集中字符串之间的比较、排序制定的规则。一种字符集可以对应多种排序规则,但是一种排序规则只能对应指定的一种字符集,两个不同的字符集不能有相同的排序规则

上图中,Collation 列表示排序方式,Charset 列表示字符集,可以看出 utf8 字符集对应着许多的排序方式,排序方式那一列每一项的值都不一样,并且每一项都对应唯一一种字符集,在这里是 utf8 字符集

默认排序规则

  • 字符集的默认排序规则

每种字符集都有一个默认的排序规则, 可以通过下面的SQL语句查询指定字符集的默认排序规则

mysql> show character set like 'utf8%';
+---------+---------------+--------------------+--------+
| Charset | Description   | Default collation  | Maxlen |
+---------+---------------+--------------------+--------+
| utf8    | UTF-8 Unicode | utf8_general_ci    |      3 |
| utf8mb4 | UTF-8 Unicode | utf8mb4_general_ci |      4 |
+---------+---------------+--------------------+--------+
2 rows in set (0.00 sec)

上面的例子是查询字符集前缀包含utf8的默认排序方式,从中可以得知:

utf8字符集的默认排序方式是 utf8_general_ci 字符集中字符最大长度占3个字节

utf8mb4 字符集的默认排序方式是 utf8mb4_general_ci 字符集中字符最大长度占4个字节

  • 数据库的默认排序规则

MySQL服务器的默认字符集可以在 /etc/my.cnf 配置中的 [mysqld] 下修改

例如:现需要把MySQL服务器的默认字符集设置为 utf8, 默认排序规则设置为 utf8_general_ci, 只需要在 /etc/my.cnf 配置文件的 [mysqld] 下添加以下子项

character-set-server=utf8
collation-server=utf8_general_ci

创建数据库的时候如果没有指定字符集,会使用MySQL服务器默认字符集和默认排序规则

假如: 在下面例子中,MySQL服务器的默认字符集和默认排序规则分别是 utf8utf8_general_ci

mysql> create database at;
Query OK, 1 row affected (0.00 sec)
mysql> select SCHEMA_NAME,DEFAULT_CHARACTER_SET_NAME,DEFAULT_COLLATION_NAME from INFORMATION_SCHEMA.SCHEMATA where SCHEMA_NAME='at';
+-------------+----------------------------+------------------------+
| SCHEMA_NAME | DEFAULT_CHARACTER_SET_NAME | DEFAULT_COLLATION_NAME |
+-------------+----------------------------+------------------------+
| at          | utf8                       | utf8_general_ci        |
+-------------+----------------------------+------------------------+
1 row in set (0.00 sec)

在上面的例子中,创建了 at 数据库,创建数据库的时候没有为数据库指定字符集和排序规则,此时会使用 MySQL服务器的默认字符集和排序规则

通过SQL语句查询 at 数据库的默认字符集和默认排序规则,结果和MySQL服务器的默认字符集和默认排序规则是一样的

排序规则命名以及名字后缀

  • 命名

排序规则的命名是以和它自身关联的字符集名字开头的,后面再接一个或多个后缀来表示指定字符集的一种排序规则

### MySQL 排序规则详解 #### 字符集与排序规则的关系 在MySQL中,字符集和排序规则紧密相连。字符集定义了用于表示字符的数据格式,而排序规则则规定了这些字符如何被比较和排序[^2]。 #### 排序规则的作用范围 MySQL允许在多个层次上指定字符集和排序规则,包括但不限于服务器级、数据库级、表级乃至列级。这种灵活性使得可以根据具体需求精确控制数据处理方式[^4]。 #### 常见的UTF8MB4排序规则 对于广泛使用的`utf8mb4`字符集而言,常见的排序规则有三种: - `utf8mb4_unicode_ci`: 使用Unicode标准来决定字母顺序,并忽略大小写的差异; - `utf8mb4_general_ci`: 类似于前者但是更加简化,在某些情况下性能更好; - `utf8mb4_bin`: 进行严格的二进制比较,即完全依据字节而不做任何转换或调整[^5]。 #### 实际应用案例 为了更好地理解上述概念,下面给出一段Python代码片段展示如何查询当前会话下的默认字符集及其对应的排序规则: ```python import mysql.connector connection = mysql.connector.connect( host='localhost', user='root', password='', ) cursor = connection.cursor() query = "SHOW VARIABLES LIKE '%character_set%';" cursor.execute(query) results = cursor.fetchall() for result in results: print(f"{result[0]}: {result[1]}") query_collation = "SELECT DEFAULT_COLLATION_NAME FROM information_schema.SCHEMATA WHERE SCHEMA_NAME = 'your_database_name'" cursor.execute(query_collation) collation_result = cursor.fetchone()[0] print(f"\nDefault collation of your database is: {collation_result}") ```
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值