快速排序:Python语言实现
什么是快速排序?
快速排序是一种常用的排序算法,比选择排序快得多。例如,C语言标准库中的函数qsort 实现的就是快速排序。像归并排序(merge sort)一样,快速排序也是一种分治的递归算法。
快速排序算法的步骤和说明
将数组SSS排序的基本算法由下列简单的四步组成:
- 如果SSS中的元素个数是000和111,则返回。
- 取SSS中任一元素vvv,称之为枢纽元(pivot)。
- 将S−{v}S - \{v\}S−{v}(即S中其余元素)划分成两个不相交的集合:S1={x∈S−{v}∣x≤v}S_{1} = \{ x \in S - \{v\} | x \le v \}S1={x∈S−{v}∣x≤v},S2={x∈S−{v}∣x≥v}S_{2} = \{ x \in S - \{v\} | x \ge v \}S2={x∈S−{v}∣x≥v}。
- 返回{quicksort(S1),后跟v,继而再quicksort(S2)}\{quicksort(S_{1}),后跟v,继而再quicksort(S_{2})\}{quicksort(S1),后跟v,继而再quicksort(S2)}。
下图给出快速排序算法的直观说明:
快速排序算法的伪码和说明
下面是对一个典型的子数组A[l…r]A[l…r]A[l…r]进行快速排序的伪代码:
QuickSort(A, l, r)
1 if l >= r
2 return
3 i = Partition(A, l, r)
4 QuickSort(A, l, i - 1)
5 QuickSort(A, i + 1, r)
而算法的核心是Partition过程:
Partition(A, l, r)
1 p = A[r]
2 i = l - 1
3 for j = l to r - 1
4 if A[j] <= p
5 i = i + 1
6 exchange A[i] with A[j]
7 exchange A[i + 1] with A[r]
8 return i + 1
下图显示了Partition如何在一个包含8个元素的数组上进行操作的过程。
Partition总是选择一个p=A[r]p = A[r]p=A[r]作为枢纽元(pivot),并围绕它来划分子数组A[l…r]A[l…r]A[l…r]。 随着程序的执行,数组被划分成4个(可能有空的)区域。 在Partition伪码的第3~6行的for循环的每一轮迭代的开始,每一个区域都满足一定的性质, 我们将这些性质作为循环不变量:
在第3~6行循环体的每一轮迭代开始时,对于任意数组下标kkk,有:
- 若l≤k≤il \le k \le il≤k≤i,则A[k]≤pA[k] \le pA[k]≤p。
- 若i+1≤k≤j−1i+1 \le k \le j-1i+1≤k≤j−1,则A[k]>pA[k] > pA[k]>p。
- 若k=rk = rk=r,则A[k]=pA[k] = pA[k]=p。
但是上述三种情况没有覆盖下标jjj到r−1r-1r−1,对应位置的值与枢纽元之间也不存在特定的大小关系。 如下图所示:
下图给出第3~6行循环体的每一轮迭代中,根据第4行中条件判断的不同结果,算法的不同处理。
快速排序算法的Python实现
基于快速排序算法的伪码,我们可以轻松的给出Python版本的实现。
首先是给出测试驱动代码:
test_quicksort.py
#!/usr/bin/env python3
# test_quicksort.py
from quicksort import quicksort
import random
def main(size = 1000):
lyst = []
for count in range(size):
lyst.append(random.randint(1, size + 1))
answer = sorted(lyst)
print(lyst)
quicksort(lyst)
print(lyst)
if answer == lyst:
print("quicksort is correct!")
else:
print("quicksort is not correct!")
if __name__ == "__main__":
main()
然后是quicksort的实现代码:
quicksort.py
#!/usr/bin/env python3
# quicksort.py
def quicksort(lyst):
quicksortHelper(lyst, 0, len(lyst) - 1)
def quicksortHelper(lyst, left, right):
if left >= right:
return
pivotLocation = partition(lyst, left, right)
quicksortHelper(lyst, left, pivotLocation - 1)
quicksortHelper(lyst, pivotLocation + 1, right)
def partition(lyst, left, right):
pivot = lyst[right]
i = left - 1
for j in range(left, right): # left to right - 1
if lyst[j] <= pivot:
i = i + 1
swap(lyst, i, j)
swap(lyst, i + 1, right)
return i + 1
def swap(lyst, i, j):
"""Exchanges the items at positions i and j."""
# You could say lyst[i], lyst[j] = lyst[j], lyst[i]
# but the following code shows what is really going on
temp = lyst[i]
lyst[i] = lyst[j]
lyst[j] = temp
快速排序算法的改进和优化
接下来,我们逐步改进和优化快速排序,最终的算法接近于C++标准库中std::sort的实现。
STEP1
首先我们把Partition过程修改成最早由C.A.R.Hoare提出时的模样, 当然这里的伪码可能与最原始Hoare版本有所出入:
Hoare-Partition(A, l, r)
01 p = A[r]
02 i = l - 1
03 j = r
04 while TRUE
05 repeat
06 i = i + 1
07 until A[i] >= p
08 repeat
09 j = j - 1
10 until j == l or A[j] <= p
11 if i < j
12 exchange A[i] with A[j]
13 else
14 break
15 exchange A[i] with A[r]
16 return i
下图显示了Hoare-Partition如何在一个包含10个元素的数组上进行操作的过程。
更新了Partition过程的完整代码如下:
quicksort.py
#!/usr/bin/env python3
# quicksort.py
def quicksort(lyst):
quicksortHelper(lyst, 0, len(lyst) - 1)
def quicksortHelper(lyst, left, right):
if left >= right:
return
pivotLocation = partition(lyst, left, right)
quicksortHelper(lyst, left, pivotLocation - 1)
quicksortHelper(lyst, pivotLocation + 1, right)
def partition(lyst, left, right):
pivot = lyst[right]
i = left - 1
j = right
while True:
while True:
i = i + 1
if lyst[i] >= pivot:
break
while True:
j = j - 1
if j == left or lyst[j] <= pivot:
break
if i < j:
swap(lyst, i, j)
else:
break
swap(lyst, i, right)
return i
def swap(lyst, i, j):
"""Exchanges the items at positions i and j."""
# You could say lyst[i], lyst[j] = lyst[j], lyst[i]
# but the following code shows what is really going on
temp = lyst[i]
lyst[i] = lyst[j]
lyst[j] = temp
STEP2
据说,对于很小的数组(N≤20N \le 20N≤20),快速排序不如插入排序。 所以,我们修正QuickSort算法,当数组长度小于某个值(这里选了10)时, 改成调用插入排序:
QuickSort(A, l, r)
1 if r - l <= 10
2 return InsertionSort(A, l, r)
3 i = Partition(A, l, r)
4 QuickSort(A, l, i - 1)
5 QuickSort(A, i + 1, r)
由于修改一目了然,且这里也不打算介绍插入排序算法,就直接给出Python实现:
quicksort.py
#!/usr/bin/env python3
# quicksort.py
def quicksort(lyst):
quicksortHelper(lyst, 0, len(lyst) - 1)
def quicksortHelper(lyst, left, right):
if right - left <= 10:
return insertionSort(lyst, left, right)
pivotLocation = partition(lyst, left, right)
quicksortHelper(lyst, left, pivotLocation - 1)
quicksortHelper(lyst, pivotLocation + 1, right)
def partition(lyst, left, right):
pivot = lyst[right]
i = left - 1
j = right
while True:
while True:
i = i + 1
if lyst[i] >= pivot:
break
while True:
j = j - 1
if j == left or lyst[j] <= pivot:
break
if i < j:
swap(lyst, i, j)
else:
break
swap(lyst, i, right)
return i
def swap(lyst, i, j):
"""Exchanges the items at positions i and j."""
# You could say lyst[i], lyst[j] = lyst[j], lyst[i]
# but the following code shows what is really going on
temp = lyst[i]
lyst[i] = lyst[j]
lyst[j] = temp
def insertionSort(lyst, left, right):
i = left + 1
while i <= right:
itemToInsert = lyst[i]
j = i - 1
while j >= 0:
if itemToInsert < lyst[j]:
lyst[j + 1] = lyst[j]
j -= 1
else:
break
lyst[j + 1] = itemToInsert
i += 1
STEP3
当Partition(划分)n个元素的子数组,产生包含了n−1n-1n−1个元素和000个元素时, 快速排序的最坏情况发生了。为了避免这种情况,通常会采用随机选择枢纽元的方式。
这里给出一个叫Median-of-Three Partitioning(三数中值分隔法)的方式,一句话来描述: 将子数组的左端、右端和中心位置上的三个元素的中值作为枢纽元。
这次先给出Python实现代码,稍后再给出解释说明:
quicksort.py
#!/usr/bin/env python3
# quicksort.py
def quicksort(lyst):
quicksortHelper(lyst, 0, len(lyst) - 1)
def quicksortHelper(lyst, left, right):
if right - left <= 10:
return insertionSort(lyst, left, right)
pivotLocation = partition(lyst, left, right)
quicksortHelper(lyst, left, pivotLocation - 1)
quicksortHelper(lyst, pivotLocation + 1, right)
def partition(lyst, left, right):
median3(lyst, left, right)
pivot = lyst[right - 1]
i = left
j = right - 1
while True:
while True:
i = i + 1
if lyst[i] >= pivot:
break
while True:
j = j - 1
if lyst[j] <= pivot:
break
if i < j:
swap(lyst, i, j)
else:
break
swap(lyst, i, right - 1)
return i
def median3(lyst, left, right):
center = (left + right) // 2
if lyst[center] < lyst[left]:
swap(lyst, center, left)
if lyst[right] < lyst[left]:
swap(lyst, left, right)
if lyst[right] < lyst[center]:
swap(lyst, center, right)
swap(lyst, center, right - 1)
def swap(lyst, i, j):
"""Exchanges the items at positions i and j."""
# You could say lyst[i], lyst[j] = lyst[j], lyst[i]
# but the following code shows what is really going on
temp = lyst[i]
lyst[i] = lyst[j]
lyst[j] = temp
def insertionSort(lyst, left, right):
i = left + 1
while i <= right:
itemToInsert = lyst[i]
j = i - 1
while j >= 0:
if itemToInsert < lyst[j]:
lyst[j + 1] = lyst[j]
j -= 1
else:
break
lyst[j + 1] = itemToInsert
i += 1
下图显示了median3(Median-of-Three)如何在一个包含10个元素的数组上进行操作的过程。
当median3调用完,枢纽元在子数组的从右数第二个元素(索引为r−1r-1r−1),
子数组的左端元素(索引为lll)小于枢纽元,
子数组的右端元素(索引为rrr)大于枢纽元,
所以Partition过程需要处理的区间就从原来的[l,r−1][l, r-1][l,r−1](索引rrr为pivot)
变成[l+1,r−2][l+1, r-2][l+1,r−2](索引r−1r-1r−1为pivoit),而且由于左右端的元素可以作为哨兵元素,
所以对于索引jjj是否越过子数组左端的判断也可以去掉了。
至此,我们就用Python实现了一个相对完整快速排序算法。
最后给出所有实现的工程代码路径:
- 《算法导论》第7章原始版本
- 《算法导论》第7章Hoare partition版本,书中伪码有问题,已修正
- Hoare partition版本,枢纽元选成最右侧元素
- Hoare partition版本,枢纽元选成最右侧元素,小于等于10个元素的子数组用插入排序
- Hoare partition版本,枢纽元选成最右侧元素,小于等于10个元素的子数组用插入排序,Pivot选择采用Median-of-Three方法
参考文档:
- 《算法导论(原书第3版)》
- 《算法详解(卷1)——算法基础》
- 《算法:C语言实现(第1-4部分)基础知识、数据结构、排序及搜索(原书第3版)》
- 《算法Ⅰ~Ⅳ(C++实现)——基础、数据结构、排序和搜索(第三版)》
- 《数据结构与算法分析——C语言描述(原书第2版)》
- 《数据结构与算法分析——C++语言描述(第四版)》
- 《数据结构(Python语言描述)》
题外话
感谢你能看到最后,给大家准备了一些福利!
感兴趣的小伙伴,赠送全套Python学习资料,包含面试题、简历资料等具体看下方。
👉CSDN大礼包🎁:全网最全《Python学习资料》免费赠送🆓!(安全链接,放心点击)
一、Python所有方向的学习路线
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。
二、Python兼职渠道推荐*
学的同时助你创收,每天花1-2小时兼职,轻松稿定生活费.
三、最新Python学习笔记
当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
四、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

👉CSDN大礼包🎁:全网最全《Python学习资料》免费赠送🆓!(安全链接,放心点击)
若有侵权,请联系删除