现在的位置: 首页 > 综合 > 正文

经典排序算法设计与分析（插入排序、冒泡排序、选择排序、shell排序、快速排序、堆排序、分配排序、基数排序、桶排序、归并排序）

2019年05月16日 ⁄ 综合 ⁄ 共 9630字 ⁄ 字号小中大 ⁄ 评论关闭

15506253

测试用例：

为了分析所有的排序情况，给出一个模板程序用于测试，通过改写mySort函数来实现不同的排序算法。测试环境为vc++6.0。可以通过改变SIZE的大小来减少或增长排序所需的时间。另外测试时间还包括函数调用时间，存在一定的误差。

[cpp]
view plain copy print ?

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
//元素的数目
#define SIZE 10000
//打印数组中的所有元素
void printAll(int buff[],int len = SIZE)
{
int i;
for (i = 0;i < len;i++)
{
printf("%d\n",buff[i]);
}
}
//排序算法
void mySort(int buff[],int len = SIZE)
{
}
int main()
{
int i;
int buff[SIZE];
double t1,t2;
srand(time(NULL));//生成随机数种子
for (i=0;i<SIZE;i++)
{
buff[i] = rand()/SIZE;//随机生成元素
}
t1=(double)clock()/CLK_TCK;
mySort(buff);//调用排序算法
t2=(double)clock()/CLK_TCK;
printf("Total time used:%f second\n",t2-t1);//计算排序所用的事件
printAll(buff,20);//打印前面的元素，用于验证
return 0;
}

1.插入排序（Insert Sort）

用算法导论中的一个例子来形容，插入排序就好像你打扑克摸牌。第一次摸一张10（不用排序）；第二次摸一张5，你就需要把5插入到10后面；第三次摸了一张7，你就需要将7插到5的后面、10的前面，以此类推。插入排序的时间复杂度n2。

[cpp]
view plain copy print ?

void mySort(int buff[],int len = SIZE)
{
int i,j,key;
for (i = 1;i < len;i++)//i表示你摸了的第i张牌，第一张牌不用排序，可以跳过
{
key = buff[i];//先记住这张牌的值
for (j = i;j > 0 && buff[j-1] > key;j--)//将这张牌依次与它之前的每张牌进行比较，直到找到比它小的牌为止
{
buff[j] = buff[j-1];//在查找的过程中，将对比过的牌向后移。
}
buff[j] = key;//将牌插入到指定位置
}
}

运行结果:

2.冒泡排序（Bubble Sort）

假设有10个数，先比较第10和第9个数，将较小的数存到9的位置；然后比较第9和8个数，此时得到的较小的数也就是第8,9,10中的最小的数。依次类推，当比较完第1和2个数之后，第一个位置存放的数就是所有元素中最小的数。在从第10个开始比较，最终将第2小的数放到第二个位置。依次执行就可以完成排序了。冒泡排序的时间复杂度n2。

[cpp]
view plain copy print ?

void mySort(int buff[],int len = SIZE)
{
int i,j,t;
for(i = 0;i < len-1;i++)//最后只剩下一个元素时不需要比较
{
for (j = len-1;j > i;j--)////从最后一个元素开始冒泡,只需要比较到i就可以了（因为i之前的元素都已经排好序了）
{
if (buff[j] < buff[j-1])//依次比较相邻的两个元素
{
t = buff[j];
buff[j] = buff[j-1];
buff[j-1] =t;
}
}
}
}

运行结果：

3.选择排序

选择排序和冒泡排序的方法基本类似，只不过它减少了交换了次数。每次比较时都只记录下最小值得下标，不进行时间的交换，直到最后才将得到的下标和第一个元素进行唯一的依次交换。选择排序的时间复杂度n2。

[cpp]
view plain copy print ?

void mySort(int buff[],int len = SIZE)
{
int i,j,t;
for(i = 0;i < len-1;i++)//最后只剩下一个元素时不需要比较
{
int index = i;//记录最小值的下标
for (j = len-1;j > i;j--)//从最后一个元素开始冒泡,只需要比较到i就可以了（因为i之前的元素都已经排好序了）
{
if (buff[j] < buff[index])//比较当前元素和当前的最小值
{
index = j;
}
}
//将最小值放到最前面的位置
t = buff[index];
buff[index] = buff[i];
buff[i] = t;
}
}

运行结果：

4.shell排序

希尔排序也称为缩小增量排序(diminishing increment sort)，它利用了插入排序最佳时间代价特性(即元素的初始排列就接近于有序，那么插入排序比较的次数最少，循环时间最短)。通过逐渐缩小增量，来将数组尽量的变得有序，再使用插入排序，这样效率更高。选择适量的增量可以提高shell排序的效率。sell排序的时间复杂度n1.5(增量每次除以3)。

[cpp]
view plain copy print ?

void insertSort(int buff[],int len = SIZE,int increase = 1)
{
int i,j,key;
for (i = increase;i < len;i+=increase)//以increase为标准取元素
{
key = buff[i];
for (j = i;j >= increase && buff[j-increase] > key;j -= increase)//以increase为元素之间的间隔距离
{
buff[j] = buff[j-increase];
}
buff[j] = key;
}
}
//排序算法
void mySort(int buff[],int len = SIZE)
{
int setp = 2;//每次缩小的倍数,不能为1，为1表示不缩小
int i,j;
for(i = len/setp;i >= 1;i /= setp)
{
for (j=0;j<i;j++)
{
insertSort(buff,len-j,i);
}
}
}

运行结果：

这是shell排序以2为增量的示例图：

5.快速排序

考虑一个BST（二叉搜索树）通过中序遍历得到的有序数组，我们可以知道BST的根节点将树分为两个部分。左子树的所有记录都比根节点要小，右子树的所有记录都比根节点要大。这里就是一种“分治”的思想。同理，将数组根据key来分为两部分，一部分比key要小，一部分比key要大。对每一部分继续划分，直到每个子部分都只包含一个元素，不就是得到了类似BST的数组了吗。快速排序的时间复杂度n*lgn。

[cpp]
view plain copy print ?

//交换数组中地址为index1,index2两元素的值
void swap(int buff[],int index1,int index2)
{
int t = buff[index1];
buff[index1] = buff[index2];
buff[index2] = t;
}
//将大数组划分为小数组,使得l左边都是小于keyValue的值，r右边都是大于keyValue的值
int partition(int buff[],int l,int r,int keyValue)
{
do
{
while (buff[++l] < keyValue);//找到从左起，第一个大于keyValue的数,用于交换
while ( r!=0 && buff[--r] > keyValue);//找到从右起，第一个小于keyValue的数，用于交换
/*
注意之所以要考虑r!=0,是为了应对特殊情况，即所有元素都大于keyValue(即数组本来就有序),
此时l位于到数组最左边，r一直移动，知道数组的最左边仍然满足buff[--r]>keyValue，继续运动就会越界，所以需要r!=0
*/
swap(buff,l,r);//将一个大值和一个小值交换
} while (l<r);
swap(buff,l,r);//由于使用的是do,while，所以在判断l<r之前进行过依次交换，但这次交换是多余的，需要再换回来
return l;//返回分割后右边部分的头位置
}
//排序算法,第一次调用使用mySort(buff,0,SIZE-1)
void mySort(int buff[],int begin,int end)
{
if (end <= begin)//0个或1个元素，此时排序已经完成，不在进行
{
return;
}
int keyIndex = (begin+end)/2;//使用中间值作为比较用的key
swap(buff,keyIndex,end);//将key放到最右边，便于partition中使用
int k = partition(buff,begin-1,end,buff[end]);
swap(buff,k,end);//总是将key放到两个部分的中间
mySort(buff,begin,k-1);
mySort(buff,k+1,end);
}

运行结果：

这里还有另一个版本的快速排序，只不过是以每个部分数组的第一个元素为轴值。

[cpp]
view plain copy print ?

int partition(int list[],int low,int high)
{
int tmp = list[low];
while (low < high) {
while (low < high && list[high] >= tmp) {
high--;
}
list[low] = list[high]; //比中轴小的记录移到低端
while (low < high && list[low] <= tmp) {
low++;
}
list[high] = list[low]; //比中轴大的记录移到高端
}
list[low] = tmp; //中轴记录到尾
return low;
}
//排序算法,第一次调用使用mySort(buff,0,SIZE-1)
void mySort(int list[],int low,int high)
{
if (low < high) {
int middle = partition(list, low, high); //将list数组进行一分为二
mySort(list, low, middle - 1); //对低字表进行递归排序
mySort(list, middle + 1, high); //对高字表进行递归排序
}
}

6.堆排序

堆是一种树形结构，最大堆中所有父节点的值都大于其子节点，最小堆相反。堆排序实质就是不断从最小堆中取出根节点，然后重新调整堆的结构，使它满足堆的性质。堆排序的时间复杂度n*lgn。

[cpp]
view plain copy print ?

void swap(int *a,int *b)
{
int t = *a;
*a = *b;
*b = t;
}
/***
* a 待排数组
* rootIndex 本次堆化的根
* maxHeapIndex 本次堆化所达到的堆数组最大索引
*/
void maxHeapify2(int a[], int rootIndex,int maxHeapIndex)
{
int lChild = rootIndex*2+1; //左儿子节点
int rChild = rootIndex*2+2; //右儿子节点
//得到父节点，左右儿子节点中最大的节点，并与父节点交换
int largest = rootIndex;
if(lChild <= maxHeapIndex && a[lChild] > a[rootIndex])
largest = lChild;
if(rChild <= maxHeapIndex && a[rChild] > a[largest])
largest = rChild;
if(largest != rootIndex)
{
swap(&a[largest],&a[rootIndex]);
maxHeapify2(a,largest,maxHeapIndex);
}
}
void heapSort2(int a[],int len)
{
int i=0;
int maxHeapIndex = len-1;
//首先建堆
for(i = (maxHeapIndex-1)/2; i >= 0;i--)
{
maxHeapify2(a,i,maxHeapIndex);
}
//最大的值放到数组末尾，然后对剩下的数组部分进行堆排序
for(i = maxHeapIndex;i >= 1;i--)
{
swap(&a[0],&a[i]);
// 交换之后，继续堆化时，堆数组最大索引要减1
maxHeapify2(a,0,i-1);
}
}
//排序算法
void mySort(int buff[],int len = SIZE)
{
heapSort2(buff,len);
}

运行结果：可以看出堆排序对大数组速度很快的

7.分配排序

示例代码：

[cpp]
view plain copy print ?

for(i = 0;i<n;i++)
{
B[ A[i] ] = A[i];
}

时间复杂度n，但不管是存储空间，还是查询效率都极低（每次必须要遍历所有的位置）。

8.基数排序

示例代码：

[cpp]
view plain copy print ?

/*
假设n个d位的元素存放在数组A中，其中1为最低位，第d位为最高位
RADIX-SORT(A,d)
for i = 0 to d
use a stable sort to sort array A on digit i
*/

算法示意图：

基数排序时间复杂度为O (nlog(r)m)，其中r为所采取的基数，m为堆数

9.桶排序

桶排序假设输入数据服从均匀分布，平均情况下时间代价为n。与基数排序类似。根据n个输入数据放到[ 0 ,1 )划分的n个相同大小的子区间，这些子区间称为桶。我们先对桶中的数据进行排序，然后遍历每个桶，得到结果。

伪代码：

[cpp]
view plain copy print ?

/*
假设输入是一个包含n个元素的数组A,且每个元素A[i]满足0<=A[i]<1.
BUCKRT-SORT(A)
n = A.length
let B[0,··,n-1] be a new array
for i = 0 to n-1
make B[i] an empty list
for i = 1 to n
insert A[i] into list B[ nA[i]下限 ]
for i = 0 to n-1
sort list B[i] with insertion sort
concatenate the lists B[0],B[1],···,B[n-1] together in order
*/

算法示意图：

10.归并排序

归并排序将一个序列分成两个长度相等的子序列，为每一个子序列排序，然后再将它们合并成一个序列。时间复杂度n*lgn。

[cpp]
view plain copy print ?

void mergeSort(int a[],int temp[],int left,int right)
{
/*
如果数组很小，直接使用插入排序
*/
int mid = (left+right)/2;
if (left == right)
{
return;
}
//将数组分成两个子序列
mergeSort(a,temp,left,mid);
mergeSort(a,temp,mid+1,right);
int i,j,k;
//将左序列顺序复制
for (i = mid;i >= left;i--)
{
temp[i] = a[i];
}
//将右序列逆序复制
for (j = 1;j <= right-mid;j++)
{
temp[right-j+1] = a[j+mid];
}
//归并
for (i = left,j = right,k = left;k <= right;k++)
{
if (temp[i]<temp[j])
a[k] = temp[i++];
else
a[k] = temp[j--];
}
}
//排序算法
void mySort(int buff[],int len = SIZE)
{
int temp[SIZE];
mergeSort(buff,temp,0,len-1);
}

运行结果：

总结：

1. 运行时间比较

SIZE = 10000
排序算法	平均运行时间(s)
插入排序	0.143000
冒泡排序	0.463000
选择排序	0.221000
shell排序	0.123000
快速排序	0.003000
堆排序	0.008000
分配排序
基数排序
桶排序
归并排序	0.003000

2、选择排序、快速排序、希尔排序、堆排序不是稳定的排序算法，冒泡排序、插入排序、归并排序和基数排序是稳定的排序算法。

排序法	平均时间	最差情形	稳定度	额外空间	备注
冒泡	O(n²)	O(n²)	稳定	O(1)	n小时较好
交换	O(n²)	O(n²)	不稳定	O(1)	n小时较好
选择	O(n²)	O(n²)	不稳定	O(1)	n小时较好
插入	O(n²)	O(n²)	稳定	O(1)	大部分已排序时较好
基数	O(logRB)	O(logRB)	稳定	O(n)	B是真数(0-9)， R是基数(个十百)
Shell	O(nlogn)	O(n^s) 1<s<2	不稳定	O(1)	s是所选分组
快速	O(nlogn)	O(n²)	不稳定	O(nlogn)	n大时较好
归并	O(nlogn)	O(nlogn)	稳定	O(1)	n大时较好
堆	O(nlogn)	O(nlogn)	不稳定	O(1)	n大时较好