排序是數(shù)據(jù)處理中經(jīng)常使用的一種重要運(yùn)算,在計算機(jī)及其應(yīng)用系統(tǒng)中,花費(fèi)在排序上的時間在系統(tǒng)運(yùn)行時間中占有很大比重;并且排序本身對推動算法分析的發(fā)展
也起很大作用。目前已有上百種排序方法,但尚未有一個最理想的盡如人意的方法,本文介紹常用的如下排序方法的C/C++實現(xiàn),并對它們進(jìn)行分析和比較。
更詳細(xì)的算法思想的介紹可以
參考這里
/*
冒泡排序 插入排序 二路插入排序 希爾排序 快速排序 選擇排序 歸并排序 堆排序算法的
C/C++實現(xiàn)。
作者:feosun
日期:2008年10月12日
參考資料:數(shù)據(jù)結(jié)構(gòu)(C語言版) 清華大學(xué)出版社
*/
#include <iostream>
using namespace std;
//交換兩個數(shù)的值
void swap(int &a,int &b)
{
int tmp;
tmp=a;
a=b;
b=tmp;
}
//屏幕輸出數(shù)組
void display(int array[],int len)
{
cout<<"the result is:"<<endl;
for (int i = 0 ;i < len;i++ )
{
cout<<array[i]<<" ";
}
cout<<endl;
}
/*
冒泡排序
算法思想:將被排序的記錄數(shù)組R[1..n]垂直排列,每個記錄R[i]看作是重量為R[i].key的氣泡。
根據(jù)輕氣泡不能在重氣泡之下的原則,從下往上掃描數(shù)組 R:凡掃描到違反本原則的
輕氣泡,就使其向上"飄浮"。如此反復(fù)進(jìn)行,直到最后任何兩個氣泡都是輕者在上,
重者在下為止。
時間復(fù)雜度 o(n^2)
空間復(fù)雜度 o(1)
比較次數(shù) n(n+1)/2
*/
void bubble_sort(int array[],int len)
{
for (int i = len-1 ;i >= 0;i-- )
{
for(int j = 0;j < i;j++)
if(array[j] > array[j+1])
swap(array[j],array[j+1]);
}
}
/*
直接插入排序
算法思想:把n個待排序的元素看成為一個有序表和一個無序表,開始時有序表中只包含一個元
素,無序表中包含有n-1個元素,排序過程中每次從無序表中取出第一個元素,將它
插入到有序表中的適當(dāng)位置,使之成為新的有序表,重復(fù)n-1次可完成排序過程。
時間復(fù)雜度 o(n^2)
空間復(fù)雜度 o(1)
比較次數(shù) n(n+1)/2
*/
void insert_sort(int array[],int len)
{
int tmp,i,j;
for(i = 1;i < len;i++)
{
if (array[i] < array[i-1])
{
tmp = array[i];
array[i] = array[i-1];
//插入到相應(yīng)位置
for (j = i-2;j >= 0;j--)
{
//往后移
if (array[j] > tmp )
array[j+1] = array[j];
else
{
array[j+1] = tmp;
break;
}
}
if(j == -1)
array[j+1] = tmp;
}
}
}
/*
2-路插入排序
算法思想:增加一個輔助空間d,把r[1]賦值給d[1],并將d[1]看成是排好序后處于中間
位置的記錄。然后從r[2]開始依次插入到d[1]之前或之后的有序序列中。
時間復(fù)雜度 o(n^2)
空間復(fù)雜度 o(1)
比較次數(shù) n(n+1)/2
*/
void bi_insert_sort(int array[],int len)
{
int* arr_d = (int *)malloc(sizeof(int) * len);
arr_d[0] = array[0];
int head = 0,tail = 0;
for (int i = 1;i < len; i++ )
{
if (array[i] > arr_d[0])
{
int j;
for ( j= tail;j>0;j--)
{
if (array[i] < arr_d[j])
arr_d[j+1] = arr_d[j];
else
break;
}
arr_d[j+1] = array[i];
tail += 1;
}
else
{
if (head ==0)
{
arr_d[len-1] = array[i];
head =len-1;
}
else
{
int j;
for (j = head;j <= len-1;j++)
{
if (array[i] > arr_d[j])
arr_d[j-1] = arr_d[j];
else
break;
}
arr_d[j-1] = array[i];
head -= 1;
}
}
}
for (int i = 0;i < len; i++)
{
int pos = (i + head );
if(pos >= len) pos -= len;
array[i] = arr_d[pos];
}
free(arr_d);
}
/*
希爾排序
算法思想:先將整個待排序記錄分割成若干子序列分別進(jìn)行直接插入排
序,待整個序列中的記錄基本有序時,再對全體記錄進(jìn)行一
次直接插入排序
時間復(fù)雜度 o(n^2)
空間復(fù)雜度 o(1)
比較次數(shù) ?
*/
void shell_insert(int array[],int d,int len)
{
int tmp,j;
for (int i = d;i < len;i++)
{
if(array[i] < array[i-d])
{
tmp = array[i];
j = i - d;
do
{
array[j+d] = array[j];
j = j - d;
} while (j >= 0 && tmp < array[j]);
array[j+d] = tmp;
}
}
}
void shell_sort(int array[],int len)
{
int inc = len;
do
{
inc = inc/2;
shell_insert(array,inc,len);
} while (inc > 1);
}
/*
快速排序
算法思想:將原問題分解為若干個規(guī)模更小但結(jié)構(gòu)與原問題相似的子問題。遞
歸地解這些子問題,然后將這些子問題的解組合成為原問題的解。
時間復(fù)雜度 o(nlogn)
空間復(fù)雜度 o(logn)
比較次數(shù) ?
*/
int partition(int array[],int low,int high)
{
int pivotkey = array[low];
while (low < high)
{
while(low < high && array[high] >= pivotkey)
--high;
swap(array[low],array[high]);
while(low < high && array[low] <= pivotkey)
++low;
swap(array[low],array[high]);
}
array[low] = pivotkey;
return low;
}
void quick_sort(int array[],int low,int high)
{
if (low < high)
{
int pivotloc = partition(array,low,high);
quick_sort(array,low,pivotloc-1);
quick_sort(array,pivotloc+1,high);
}
}
/*
直接選擇排序
算法思想:每一趟在n-i+1個記錄中選取關(guān)鍵字最小的記錄作為有序序列中的第i個記錄
時間復(fù)雜度 o(n^2)
空間復(fù)雜度 o(1) ?
比較次數(shù) n(n+1)/2
*/
int SelectMinKey(int array[],int iPos,int len)
{
int ret = 0;
for (int i = iPos; i < len; i++)
{
if (array[ret] > array[i])
{
ret = i;
}
}
return ret;
}
void select_sort(int array[],int len)
{
for (int i = 0; i < len; i++)
{
int j = SelectMinKey(array,i,len);
if (i != j)
{
swap(array[i],array[j]);
}
}
}
/*
歸并排序
算法思想:設(shè)兩個有序的子文件(相當(dāng)于輸入堆)放在同一向量中相鄰的位置上:R[low..m],R[m+1..high],先
將它們合并到一個局部的暫存向量R1(相當(dāng)于輸出堆)中,待合并完成后將R1復(fù)制回R[low..high]中。
時間復(fù)雜度 o(nlogn)
空間復(fù)雜度 o(n)
比較次數(shù) ?
*/
void merge(int array[],int i,int m, int n)
{
int j,k;
int iStart = i, iEnd = n;
int arrayDest[256];
for ( j = m + 1,k = i; i <= m && j <= n; ++k)
{
if (array[i] < array[j])
arrayDest[k] = array[i++];
else
arrayDest[k] = array[j++];
}
if (i <= m)
for (;k <= n; k++,i++)
arrayDest[k] = array[i];
if(j <= n)
for (;k <= n; k++,j++)
arrayDest[k] = array[j];
for(j = iStart; j <= iEnd; j++)
array[j] = arrayDest[j];
}
void merge_sort(int array[],int s,int t)
{
int m;
if (s < t)
{
m = (s + t )/2;
merge_sort(array,s,m);
merge_sort(array,m+1,t);
merge(array,s,m,t);
}
}
/*
堆排序
算法思想:堆排序(Heap Sort)是指利用堆(heaps)這種數(shù)據(jù)結(jié)構(gòu)來構(gòu)造的一種排序算法。
堆是一個近似完全二叉樹結(jié)構(gòu),并同時滿足堆屬性:即子節(jié)點的鍵值或索引總是
小于(或者大于)它的父節(jié)點。
時間復(fù)雜度 o(nlogn)
空間復(fù)雜度 o(1)
比較次數(shù) 較多
*/
void heap_adjust(int array[],int i,int len)
{
int rc = array[i];
for(int j = 2 * i; j <len; j *= 2)
{
if(j < len && array[j] < array[j+1]) j++;
if(rc >= array[j]) break;
array[i] = array[j]; i = j;
}
array[i] = rc;
}
void heap_sort(int array[],int len)
{
int i;
for(i = (len-1)/2; i >= 0; i--)
heap_adjust(array,i,len);
for( i = (len-1); i > 0; i--)
{
swap(array[0],array[i]); //彈出最大值,重新對i-1個元素建堆
heap_adjust(array,0,i-1);
}
}
int main() {
int array[] = {45,56,76,234,1,34,23,2,3,55,88,100};
int len = sizeof(array)/sizeof(int);
//bubble_sort(array,len); //冒泡排序
/*insert_sort(array,len);*/ //插入排序
/*bi_insert_sort(array,len);*/ //二路插入排序
/*shell_sort(array,len);*/ //希爾排序
/*quick_sort(array,0,len-1);*/ //快速排序
/*select_sort(array,len);*/ //選擇排序
/*merge_sort(array,0,len-1);*/ //歸并排序
heap_sort(array,len); //堆排序
display(array,len);
return 0;
}
選擇排序、快速排序、希爾排序、堆排序不是穩(wěn)定的排序算法,而冒泡排序、插入排序、歸并排序和基數(shù)排序是穩(wěn)定的排序算法。
首先,排序算法的穩(wěn)定性大家應(yīng)該都知道,通俗地講就是能保證排序前2個相等的數(shù)其在序列的前后位置順序和排序后它們兩個的前后位置順序相同。在簡單形式化一下,如果Ai = Aj, Ai原來在位置前,排序后Ai還是要在Aj位置前。
其次,說一下穩(wěn)定性的好處。排序算法如果是穩(wěn)定的,那么從一個鍵上排序,然后再從另一個鍵上排序,第一個鍵排序的結(jié)果可以為第二個鍵排序所用。基數(shù)排序就
是這樣,先按低位排序,逐次按高位排序,低位相同的元素其順序再高位也相同時是不會改變的。另外,如果排序算法穩(wěn)定,對基于比較的排序算法而言,元素交換
的次數(shù)可能會少一些(個人感覺,沒有證實)。
回到主題,現(xiàn)在分析一下常見的排序算法的穩(wěn)定性,每個都給出簡單的理由。
(1)冒泡排序
冒泡排序就是把小的元素往前調(diào)或者把大的元素往后調(diào)。比較是相鄰的兩個元素比較,交換也發(fā)生在這兩個元素之間。所以,如果兩個元素相等,我想你是不會再無
聊地把他們倆交換一下的;如果兩個相等的元素沒有相鄰,那么即使通過前面的兩兩交換把兩個相鄰起來,這時候也不會交換,所以相同元素的前后順序并沒有改
變,所以冒泡排序是一種穩(wěn)定排序算法。
(2)選擇排序
選擇排序是給每個位置選擇當(dāng)前元素最小的,比如給第一個位置選擇最小的,在剩余元素里面給第二個元素選擇第二小的,依次類推,直到第n-1個元素,第n個
元素不用選擇了,因為只剩下它一個最大的元素了。那么,在一趟選擇,如果當(dāng)前元素比一個元素小,而該小的元素又出現(xiàn)在一個和當(dāng)前元素相等的元素后面,那么
交換后穩(wěn)定性就被破壞了。比較拗口,舉個例子,序列5 8 5 2
9,我們知道第一遍選擇第1個元素5會和2交換,那么原序列中2個5的相對前后順序就被破壞了,所以選擇排序不是一個穩(wěn)定的排序算法。
(3)插入排序
插入排序是在一個已經(jīng)有序的小序列的基礎(chǔ)上,一次插入一個元素。當(dāng)然,剛開始這個有序的小序列只有1個元素,就是第一個元素。比較是從有序序列的末尾開
始,也就是想要插入的元素和已經(jīng)有序的最大者開始比起,如果比它大則直接插入在其后面,否則一直往前找直到找到它該插入的位置。如果碰見一個和插入元素相
等的,那么插入元素把想插入的元素放在相等元素的后面。所以,相等元素的前后順序沒有改變,從原無序序列出去的順序就是排好序后的順序,所以插入排序是穩(wěn)
定的。
(4)快速排序
快速排序有兩個方向,左邊的i下標(biāo)一直往右走,當(dāng)a[i] <=
a[center_index],其中center_index是中樞元素的數(shù)組下標(biāo),一般取為數(shù)組第0個元素。而右邊的j下標(biāo)一直往左走,當(dāng)a[j]
> a[center_index]。如果i和j都走不動了,i <= j,
交換a[i]和a[j],重復(fù)上面的過程,直到i>j。交換a[j]和a[center_index],完成一趟快速排序。在中樞元素和a[j]交
換的時候,很有可能把前面的元素的穩(wěn)定性打亂,比如序列為 5 3 3 4 3 8 9 10
11,現(xiàn)在中樞元素5和3(第5個元素,下標(biāo)從1開始計)交換就會把元素3的穩(wěn)定性打亂,所以快速排序是一個不穩(wěn)定的排序算法,不穩(wěn)定發(fā)生在中樞元素和
a[j] 交換的時刻。
(5)歸并排序
歸并排序是把序列遞歸地分成短序列,遞歸出口是短序列只有1個元素(認(rèn)為直接有序)或者2個序列(1次比較和交換),然后把各個有序的段序列合并成一個有
序的長序列,不斷合并直到原序列全部排好序。可以發(fā)現(xiàn),在1個或2個元素時,1個元素不會交換,2個元素如果大小相等也沒有人故意交換,這不會破壞穩(wěn)定
性。那么,在短的有序序列合并的過程中,穩(wěn)定是是否受到破壞?沒有,合并過程中我們可以保證如果兩個當(dāng)前元素相等時,我們把處在前面的序列的元素保存在結(jié)
果序列的前面,這樣就保證了穩(wěn)定性。所以,歸并排序也是穩(wěn)定的排序算法。
(6)基數(shù)排序
基數(shù)排序是按照低位先排序,然后收集;再按照高位排序,然后再收集;依次類推,直到最高位。有時候有些屬性是有優(yōu)先級順序的,先按低優(yōu)先級排序,再按高優(yōu)
先級排序,最后的次序就是高優(yōu)先級高的在前,高優(yōu)先級相同的低優(yōu)先級高的在前。基數(shù)排序基于分別排序,分別收集,所以其是穩(wěn)定的排序算法。
(7)希爾排序(shell)
希爾排序是按照不同步長對元素進(jìn)行插入排序,當(dāng)剛開始元素很無序的時候,步長最大,所以插入排序的元素個數(shù)很少,速度很快;當(dāng)元素基本有序了,步長很小,
插入排序?qū)τ谟行虻男蛄行屎芨摺K裕柵判虻臅r間復(fù)雜度會比o(n^2)好一些。由于多次插入排序,我們知道一次插入排序是穩(wěn)定的,不會改變相同元
素的相對順序,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,最后其穩(wěn)定性就會被打亂,所以shell排序是不穩(wěn)定的。
(8)堆排序
我們知道堆的結(jié)構(gòu)是節(jié)點i的孩子為2*i和2*i+1節(jié)點,大頂堆要求父節(jié)點大于等于其2個子節(jié)點,小頂堆要求父節(jié)點小于等于其2個子節(jié)點。在一個長為n
的序列,堆排序的過程是從第n/2開始和其子節(jié)點共3個值選擇最大(大頂堆)或者最小(小頂堆),這3個元素之間的選擇當(dāng)然不會破壞穩(wěn)定性。但當(dāng)為n
/2-1, n/2-2,
...1這些個父節(jié)點選擇元素時,就會破壞穩(wěn)定性。有可能第n/2個父節(jié)點交換把后面一個元素交換過去了,而第n/2-1個父節(jié)點把后面一個相同的元素沒
有交換,那么這2個相同的元素之間的穩(wěn)定性就被破壞了。所以,堆排序不是穩(wěn)定的排序算法。