现在的位置: 首页 > 综合 > 正文

线性时间排序之——基数排序

2019年03月01日 ⁄ 综合 ⁄ 共 1609字 ⁄ 字号 评论关闭

我们知道,传统的比较排序法的时间复杂度是有下界的,最快也不会快于O(nlgn),比较排序顾名思义就是通过元素间的相互比较大小,完成排序,例如快速排序、堆排序、插入排序等等。而非比较排序法则可以做到在线性时间内排序。

为了介绍基数排序,我们先来介绍一种特例——计数排序。

计数排序为了实现线性时间排序,是需要条件的:我们需要知道待排序数据的范围。

计数排序对输入的数据有附加的限制条件:
1、输入的线性表的元素属于有限偏序集S;
2、设输入的线性表的长度为n,|S|=k(表示集合S中元素的总数目为k),则k=O(n)。
在这两个条件下,计数排序的复杂性为O(n)。
计数排序的基本思想是对于给定的输入序列中的每一个元素x,确定该序列中值小于x的元素的个数。一旦有了这个信息,就可以将x直接存放到最终的输出序列的正确位置上。例如,如果输入序列中只有17个元素的值小于x的值,则x可以直接存放在输出序列的第18个位置上。当然,如果有多个元素具有相同的值时,我们不能将这些元素放在输出序列的同一个位置上,因此,上述方案还要作适当的修改。
假设输入的线性表L的长度为n,L=L1,L2,..,Ln;线性表的元素属于有限偏序集S,|S|=k且k=O(n),S={S1,S2,..Sk};则计数排序可以描述如下:
1、扫描整个集合S,对每一个Si∈S,找到在线性表L中小于等于Si的元素的个数T(Si);
2、扫描整个线性表L,对L中的每一个元素Li,将Li放在输出线性表的第T(Li)个位置上,并将T(Li)减1。

#include <iostream>
using namespace std;

void counting_sort(int *A, int *B, int size, int range)
{
	int *C = new int[range + 1];
	for(int i = 0; i < range + 1; i++)
		C[i] = 0;
	for(int i = 0; i < size; i++)
		C[A[i]]++;
	for(int i = 1; i < range + 1; i++)
		C[i] = C[i-1] + C[i];

	for(int i = size - 1; i >= 0; i--)
	{
		B[C[A[i]] - 1] = A[i];
		C[A[i]]--;
	}
}

int main()
{
	int A[8] = {2, 5, 3, 0, 2, 3, 0, 3};
	int B[8] = {0};
	counting_sort(A, B, 8, 5);
	for(int i = 0; i < 8; i++)
		cout<<B[i]<<" ";
	return 0;
}

基数排序也是有条件的,那就是待排序的必须是数字。我们先按最低位,也就是个位数将数组排序,然后再按十位数排序,依次直到最高位。这里的每次排序都使用计数排序,因为计数排序是稳定的,基数排序就是依赖计数排序的稳定性来进行排序的。

但是,利用计数排序作为中间稳定排序的基数排序不是原地排序,很多比较排序的算法可以做到原地排序,因此,当内存宝贵时,快速排序更为可取。

例如

待排序数组[62,14,59,88,16]简单点五个数字

分配10个桶,桶编号为0-9,以个位数数字为桶编号依次入桶,变成下边这样

|  0  |  0  | 62 |  0  | 14 |  0  | 16 |  0  |  88 | 59 |

|  0  |  1  |  2  |  3  |  4 |  5  |  6  |  7  |  8  |  9  |桶编号

将桶里的数字顺序取出来,

输出结果:[62,14,16,88,59]

再次入桶,不过这次以十位数的数字为准,进入相应的桶,变成下边这样:

由于前边做了个位数的排序,所以当十位数相等时,个位数字是由小到大的顺序入桶的,就是说,入完桶还是有序

|  0  | 14,16 |  0  |  0  |  0  | 59 | 62  | 0  | 88  |  0  |

|  0  |  1      |  2  |  3  |  4  |  5  |  6  |  7  |  8  |  9  |桶编号


因为没有大过100的数字,没有百位数,所以到这排序完毕,顺序取出即可

最后输出结果:[14,16,59,62,88]

抱歉!评论已关闭.