数据库优化<六>SQL优化之SELECT优化 ——filesort

最新推荐文章于 2024-04-05 11:34:17 发布

清风乐逍遥

最新推荐文章于 2024-04-05 11:34:17 发布

阅读量2.7k

点赞数 3

分类专栏： mysql 文章标签： mysql filesort原理数据库优化

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xiaobing_blog/article/details/17152777

版权

mysql 专栏收录该内容

9 篇文章

订阅专栏

本文深入解析了MySQL中filesort的工作原理，包括其涉及的快速排序和归并排序步骤，以及如何通过调整参数如sort_buffer_size和max_length_for_sort_data来优化性能。建议包括减小max_length_for_sort_data以利用更高效的方法，增加sort_buffer_size以减少磁盘I/O，以及设置多物理盘的tmpdir以分散临时文件存储。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

在执行计划中，可能经常看到有Extra列有filesort，这就是使用了文件排序，这当然是不好

的，应该优化，但是，了解一下他排序的原理也许很有帮助，下面看一下filesort的过程：

1、根据表的索引或者全表扫描，读取所有满足条件的记录

2、对与每一行，存储一对儿值到缓冲区，一个是排序的索引列的值，即order by用到

的列值，和执向该行数据的行指针，缓冲区的大小为sort_buffer_size大小

3、当缓冲区满后，运行一个快速排序（qsort）来将缓冲区中数据排序，并将排序完的

数据存储到一个临时文件，并保存一个存储块儿的指针，当然，如果缓冲区不满，

则不会重建临时文件了

4、重复以上步骤，直到将所有行读完，并建立相应的有序的临时文件

5、对块级进行排序，这个类似与归并排序算法，只通过两个临时文件的指针来不断交换

数据，最终达到两个文件，都是有序的

6、重复5,直到所有的数据都排序完毕

7、采取顺序读的方式，将每行数据读入内存，并取出数据传到客户端，这里读取数据时

并不是一行一行读，读如缓存大小由read_rnd_buffer_size来指定

这就是filesort的过程，采取的方法为：快速排序 + 归并排序，但有一个问题，就是，一行数据会

被读两次，第一次是where条件过滤时，第二个是排完序后还得用行指针去读一次，一个优化的

方法是，直接读入数据，排序的时候也根据这个排序，排序完成后，就直接发送到客户端了，

过程如下：

1、读取满足条件的记录

2、对于每一行，记录排序的key和数据行位置，并且把要查询的列也读出来

3、根据索引key排序

4、读取排序完成的文件，并直接根据数据位置读取数据返回客户端，而不是去访问表

这也有一个问题：当获取的列很多的时候，排序起来就很占空间，因此，max_length_for_sort_data

变量就决定了是否能使用这个排序算法

建议：

1、对于使用filesort的慢查询，可以改小一些max_length_for_sort_data来使用第一个方法

2、对于想要加快order by 的顺序，有以下一些策略：

a、增加sort_buffer_size的大小，如果大量的查询较小的话，这个很好，就缓存中就搞定了

b、增加read_rnd_buffer_size大小，可以一次性多读到内存中

c、列的长度尽量小些

d、改变tmpdir，使其指向多个物理盘(不是分区)的目录，这将机会循环使用做为临时文件区

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。