posts - 297, comments - 15, trackbacks - 0

各種排序算法

另外連接：http://blog.csdn.net/fly_lb/category/368127.aspx
排序算法是一種基本并且常用的算法。由于實(shí)際工作中處理的數(shù)量巨大，所以排序算法
對算法本身的速度要求很高。
  而一般我們所謂的算法的性能主要是指算法的復(fù)雜度，一般用O方法來表示。在后面我將
給出詳細(xì)的說明。

  對于排序的算法我想先做一點(diǎn)簡單的介紹，也是給這篇文章理一個提綱。
  我將按照算法的復(fù)雜度，從簡單到難來分析算法。
  第一部分是簡單排序算法，后面你將看到他們的共同點(diǎn)是算法復(fù)雜度為O(N*N)（因?yàn)闆]有
使用word,所以無法打出上標(biāo)和下標(biāo)）。
  第二部分是高級排序算法，復(fù)雜度為O(Log2(N))。這里我們只介紹一種算法。另外還有幾種
算法因?yàn)樯婕皹渑c堆的概念，所以這里不于討論。
  第三部分類似動腦筋。這里的兩種算法并不是最好的（甚至有最慢的），但是算法本身比較
奇特，值得參考（編程的角度）。同時(shí)也可以讓我們從另外的角度來認(rèn)識這個問題。
  第四部分是我送給大家的一個餐后的甜點(diǎn)——一個基于模板的通用快速排序。由于是模板函數(shù)
可以對任何數(shù)據(jù)類型排序（抱歉，里面使用了一些論壇專家的呢稱）。

  現(xiàn)在，讓我們開始吧：

一、簡單排序算法
由于程序比較簡單，所以沒有加什么注釋。所有的程序都給出了完整的運(yùn)行代碼，并在我的VC環(huán)境
下運(yùn)行通過。因?yàn)闆]有涉及MFC和WINDOWS的內(nèi)容，所以在BORLAND C++的平臺上應(yīng)該也不會有什么
問題的。在代碼的后面給出了運(yùn)行過程示意，希望對理解有幫助。

1.冒泡法：
這是最原始，也是眾所周知的最慢的算法了。他的名字的由來因?yàn)樗墓ぷ骺磥硐笫敲芭荩?
#include <iostream.h>

void BubbleSort(int* pData,int Count)
{
  int iTemp;
  for(int i=1;i<Count;i++)
  {
    for(int j=Count-1;j>=i;j--)
    {
      if(pData[j]<pData[j-1])
      {
        iTemp = pData[j-1];
        pData[j-1] = pData[j];
        pData[j] = iTemp;
      }
    }
  }
}

void main()
{
  int data[] = {10,9,8,7,6,5,4};
  BubbleSort(data,7);
  for (int i=0;i<7;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}

倒序(最糟情況)
第一輪：10,9,8,7->10,9,7,8->10,7,9,8->7,10,9,8(交換3次)
第二輪：7,10,9,8->7,10,8,9->7,8,10,9(交換2次)
第一輪：7,8,10,9->7,8,9,10(交換1次)
循環(huán)次數(shù)：6次
交換次數(shù)：6次

其他：
第一輪：8,10,7,9->8,10,7,9->8,7,10,9->7,8,10,9(交換2次)
第二輪：7,8,10,9->7,8,10,9->7,8,10,9(交換0次)
第一輪：7,8,10,9->7,8,9,10(交換1次)
循環(huán)次數(shù)：6次
交換次數(shù)：3次

上面我們給出了程序段，現(xiàn)在我們分析它：這里，影響我們算法性能的主要部分是循環(huán)和交換，
顯然，次數(shù)越多，性能就越差。從上面的程序我們可以看出循環(huán)的次數(shù)是固定的，為1+2+...+n-1。
寫成公式就是1/2*(n-1)*n。
現(xiàn)在注意，我們給出O方法的定義：

  若存在一常量K和起點(diǎn)n0，使當(dāng)n>=n0時(shí)，有f(n)<=K*g(n),則f(n) = O(g(n))。（呵呵，不要說沒
學(xué)好數(shù)學(xué)呀，對于編程數(shù)學(xué)是非常重要的！！！）

現(xiàn)在我們來看1/2*(n-1)*n，當(dāng)K=1/2，n0=1，g(n)=n*n時(shí)，1/2*(n-1)*n<=1/2*n*n=K*g(n)。所以f(n)
=O(g(n))=O(n*n)。所以我們程序循環(huán)的復(fù)雜度為O(n*n)。
再看交換。從程序后面所跟的表可以看到，兩種情況的循環(huán)相同，交換不同。其實(shí)交換本身同數(shù)據(jù)源的
有序程度有極大的關(guān)系，當(dāng)數(shù)據(jù)處于倒序的情況時(shí)，交換次數(shù)同循環(huán)一樣（每次循環(huán)判斷都會交換），
復(fù)雜度為O(n*n)。當(dāng)數(shù)據(jù)為正序，將不會有交換。復(fù)雜度為O(0)。亂序時(shí)處于中間狀態(tài)。正是由于這樣的
原因，我們通常都是通過循環(huán)次數(shù)來對比算法。

2.交換法：
交換法的程序最清晰簡單，每次用當(dāng)前的元素一一的同其后的元素比較并交換。
#include <iostream.h>
void ExchangeSort(int* pData,int Count)
{
  int iTemp;
  for(int i=0;i<Count-1;i++)
  {
    for(int j=i+1;j<Count;j++)
    {
      if(pData[j]<pData[i])
      {
        iTemp = pData[i];
        pData[i] = pData[j];
        pData[j] = iTemp;
      }
    }
  }
}

void main()
{
  int data[] = {10,9,8,7,6,5,4};
  ExchangeSort(data,7);
  for (int i=0;i<7;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}
倒序(最糟情況)
第一輪：10,9,8,7->9,10,8,7->8,10,9,7->7,10,9,8(交換3次)
第二輪：7,10,9,8->7,9,10,8->7,8,10,9(交換2次)
第一輪：7,8,10,9->7,8,9,10(交換1次)
循環(huán)次數(shù)：6次
交換次數(shù)：6次

其他：
第一輪：8,10,7,9->8,10,7,9->7,10,8,9->7,10,8,9(交換1次)
第二輪：7,10,8,9->7,8,10,9->7,8,10,9(交換1次)
第一輪：7,8,10,9->7,8,9,10(交換1次)
循環(huán)次數(shù)：6次
交換次數(shù)：3次

從運(yùn)行的表格來看，交換幾乎和冒泡一樣糟。事實(shí)確實(shí)如此。循環(huán)次數(shù)和冒泡一樣
也是1/2*(n-1)*n，所以算法的復(fù)雜度仍然是O(n*n)。由于我們無法給出所有的情況，所以
只能直接告訴大家他們在交換上面也是一樣的糟糕（在某些情況下稍好，在某些情況下稍差）。

3.選擇法：
現(xiàn)在我們終于可以看到一點(diǎn)希望：選擇法，這種方法提高了一點(diǎn)性能（某些情況下）
這種方法類似我們?nèi)藶榈呐判蛄?xí)慣：從數(shù)據(jù)中選擇最小的同第一個值交換，在從省下的部分中
選擇最小的與第二個交換，這樣往復(fù)下去。
#include <iostream.h>
void SelectSort(int* pData,int Count)
{
  int iTemp;
  int iPos;
  for(int i=0;i<Count-1;i++)
  {
    iTemp = pData[i];
    iPos = i;
    for(int j=i+1;j<Count;j++)
    {
      if(pData[j]<iTemp)
      {
        iTemp = pData[j];
        iPos = j;
      }
    }
    pData[iPos] = pData[i];
    pData[i] = iTemp;
  }
}

void main()
{
  int data[] = {10,9,8,7,6,5,4};
  SelectSort(data,7);
  for (int i=0;i<7;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}
倒序(最糟情況)
第一輪：10,9,8,7->(iTemp=9)10,9,8,7->(iTemp=8)10,9,8,7->(iTemp=7)7,9,8,10(交換1次)
第二輪：7,9,8,10->7,9,8,10(iTemp=8)->(iTemp=8)7,8,9,10(交換1次)
第一輪：7,8,9,10->(iTemp=9)7,8,9,10(交換0次)
循環(huán)次數(shù)：6次
交換次數(shù)：2次

其他：
第一輪：8,10,7,9->(iTemp=8)8,10,7,9->(iTemp=7)8,10,7,9->(iTemp=7)7,10,8,9(交換1次)
第二輪：7,10,8,9->(iTemp=8)7,10,8,9->(iTemp=8)7,8,10,9(交換1次)
第一輪：7,8,10,9->(iTemp=9)7,8,9,10(交換1次)
循環(huán)次數(shù)：6次
交換次數(shù)：3次
遺憾的是算法需要的循環(huán)次數(shù)依然是1/2*(n-1)*n。所以算法復(fù)雜度為O(n*n)。
我們來看他的交換。由于每次外層循環(huán)只產(chǎn)生一次交換（只有一個最小值）。所以f(n)<=n
所以我們有f(n)=O(n)。所以，在數(shù)據(jù)較亂的時(shí)候，可以減少一定的交換次數(shù)。

4.插入法：
插入法較為復(fù)雜，它的基本工作原理是抽出牌，在前面的牌中尋找相應(yīng)的位置插入，然后繼續(xù)下一張
#include <iostream.h>
void InsertSort(int* pData,int Count)
{
  int iTemp;
  int iPos;
  for(int i=1;i<Count;i++)
  {
    iTemp = pData[i];
    iPos = i-1;
    while((iPos>=0) && (iTemp<pData[iPos]))
    {
      pData[iPos+1] = pData[iPos];
      iPos--;
    }
    pData[iPos+1] = iTemp;
  }
}

void main()
{
  int data[] = {10,9,8,7,6,5,4};
  InsertSort(data,7);
  for (int i=0;i<7;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}

倒序(最糟情況)
第一輪：10,9,8,7->9,10,8,7(交換1次)(循環(huán)1次)
第二輪：9,10,8,7->8,9,10,7(交換1次)(循環(huán)2次)
第一輪：8,9,10,7->7,8,9,10(交換1次)(循環(huán)3次)
循環(huán)次數(shù)：6次
交換次數(shù)：3次

其他：
第一輪：8,10,7,9->8,10,7,9(交換0次)(循環(huán)1次)
第二輪：8,10,7,9->7,8,10,9(交換1次)(循環(huán)2次)
第一輪：7,8,10,9->7,8,9,10(交換1次)(循環(huán)1次)
循環(huán)次數(shù)：4次
交換次數(shù)：2次

上面結(jié)尾的行為分析事實(shí)上造成了一種假象，讓我們認(rèn)為這種算法是簡單算法中最好的，其實(shí)不是，
因?yàn)槠溲h(huán)次數(shù)雖然并不固定，我們?nèi)钥梢允褂肙方法。從上面的結(jié)果可以看出，循環(huán)的次數(shù)f(n)<=
1/2*n*(n-1)<=1/2*n*n。所以其復(fù)雜度仍為O(n*n)（這里說明一下，其實(shí)如果不是為了展示這些簡單
排序的不同，交換次數(shù)仍然可以這樣推導(dǎo)）。現(xiàn)在看交換，從外觀上看，交換次數(shù)是O(n)（推導(dǎo)類似
選擇法），但我們每次要進(jìn)行與內(nèi)層循環(huán)相同次數(shù)的‘=’操作。正常的一次交換我們需要三次‘=’
而這里顯然多了一些，所以我們浪費(fèi)了時(shí)間。

最終，我個人認(rèn)為，在簡單排序算法中，選擇法是最好的。

二、高級排序算法：
高級排序算法中我們將只介紹這一種，同時(shí)也是目前我所知道（我看過的資料中）的最快的。
它的工作看起來仍然象一個二叉樹。首先我們選擇一個中間值middle程序中我們使用數(shù)組中間值，然后
把比它小的放在左邊，大的放在右邊（具體的實(shí)現(xiàn)是從兩邊找，找到一對后交換）。然后對兩邊分別使
用這個過程（最容易的方法——遞歸）。

1.快速排序：
#include <iostream.h>

void run(int* pData,int left,int right)
{
  int i,j;
  int middle,iTemp;
  i = left;
  j = right;
  middle = pData[(left+right)/2]; //求中間值
  do{
    while((pData[i]<middle) && (i<right))//從左掃描大于中值的數(shù)
      i++;
    while((pData[j]>middle) && (j>left))//從右掃描大于中值的數(shù)
      j--;
    if(i<=j)//找到了一對值
    {
      //交換
      iTemp = pData[i];
      pData[i] = pData[j];
      pData[j] = iTemp;
      i++;
      j--;
    }
  }while(i<=j);//如果兩邊掃描的下標(biāo)交錯，就停止（完成一次）

  //當(dāng)左邊部分有值(left<j)，遞歸左半邊
  if(left<j)
    run(pData,left,j);
  //當(dāng)右邊部分有值(right>i)，遞歸右半邊
  if(right>i)
    run(pData,i,right);
}

void QuickSort(int* pData,int Count)
{
  run(pData,0,Count-1);
}

void main()
{
  int data[] = {10,9,8,7,6,5,4};
  QuickSort(data,7);
  for (int i=0;i<7;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}

這里我沒有給出行為的分析，因?yàn)檫@個很簡單，我們直接來分析算法：首先我們考慮最理想的情況
1.數(shù)組的大小是2的冪，這樣分下去始終可以被2整除。假設(shè)為2的k次方，即k=log2(n)。
2.每次我們選擇的值剛好是中間值，這樣，數(shù)組才可以被等分。
第一層遞歸，循環(huán)n次，第二層循環(huán)2*(n/2)......
所以共有n+2(n/2)+4(n/4)+...+n*(n/n) = n+n+n+...+n=k*n=log2(n)*n
所以算法復(fù)雜度為O(log2(n)*n)
其他的情況只會比這種情況差，最差的情況是每次選擇到的middle都是最小值或最大值，那么他將變
成交換法（由于使用了遞歸，情況更糟）。但是你認(rèn)為這種情況發(fā)生的幾率有多大？？呵呵，你完全
不必?fù)?dān)心這個問題。實(shí)踐證明，大多數(shù)的情況，快速排序總是最好的。
如果你擔(dān)心這個問題，你可以使用堆排序，這是一種穩(wěn)定的O(log2(n)*n)算法，但是通常情況下速度要慢
于快速排序（因?yàn)橐亟M堆）。

三、其他排序
1.雙向冒泡：
通常的冒泡是單向的，而這里是雙向的，也就是說還要進(jìn)行反向的工作。
代碼看起來復(fù)雜，仔細(xì)理一下就明白了，是一個來回震蕩的方式。
寫這段代碼的作者認(rèn)為這樣可以在冒泡的基礎(chǔ)上減少一些交換（我不這么認(rèn)為，也許我錯了）。
反正我認(rèn)為這是一段有趣的代碼，值得一看。
#include <iostream.h>
void Bubble2Sort(int* pData,int Count)
{
  int iTemp;
  int left = 1;
  int right =Count -1;
  int t;
  do
  {
    //正向的部分
    for(int i=right;i>=left;i--)
    {
      if(pData[i]<pData[i-1])
      {
        iTemp = pData[i];
        pData[i] = pData[i-1];
        pData[i-1] = iTemp;
        t = i;
      }
    }
    left = t+1;

    //反向的部分
    for(i=left;i<right+1;i++)
    {
      if(pData[i]<pData[i-1])
      {
        iTemp = pData[i];
        pData[i] = pData[i-1];
        pData[i-1] = iTemp;
        t = i;
      }
    }
    right = t-1;
  }while(left<=right);
}

void main()
{
  int data[] = {10,9,8,7,6,5,4};
  Bubble2Sort(data,7);
  for (int i=0;i<7;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}

2.SHELL排序
這個排序非常復(fù)雜，看了程序就知道了。
首先需要一個遞減的步長，這里我們使用的是9、5、3、1（最后的步長必須是1）。
工作原理是首先對相隔9-1個元素的所有內(nèi)容排序，然后再使用同樣的方法對相隔5-1個元素的排序
以次類推。
#include <iostream.h>
void ShellSort(int* pData,int Count)
{
  int step[4];
  step[0] = 9;
  step[1] = 5;
  step[2] = 3;
  step[3] = 1;

  int iTemp;
  int k,s,w;
  for(int i=0;i<4;i++)
  {
    k = step[i];
    s = -k;
    for(int j=k;j<Count;j++)
    {
      iTemp = pData[j];
      w = j-k;//求上step個元素的下標(biāo)
      if(s ==0)
      {
        s = -k;
        s++;
        pData[s] = iTemp;
      }
      while((iTemp<pData[w]) && (w>=0) && (w<=Count))
      {
        pData[w+k] = pData[w];
        w = w-k;
      }
      pData[w+k] = iTemp;
    }
  }
}

void main()
{
  int data[] = {10,9,8,7,6,5,4,3,2,1,-10,-1};
  ShellSort(data,12);
  for (int i=0;i<12;i++)
    cout<<data[i]<<" ";
  cout<<"\n";
}
呵呵，程序看起來有些頭疼。不過也不是很難，把s==0的塊去掉就輕松多了，這里是避免使用0
步長造成程序異常而寫的代碼。這個代碼我認(rèn)為很值得一看。
這個算法的得名是因?yàn)槠浒l(fā)明者的名字D.L.SHELL。依照參考資料上的說法：“由于復(fù)雜的數(shù)學(xué)原因
避免使用2的冪次步長，它能降低算法效率。”另外算法的復(fù)雜度為n的1.2次冪。同樣因?yàn)榉浅?fù)雜并
“超出本書討論范圍”的原因（我也不知道過程），我們只有結(jié)果了。

四、基于模板的通用排序：
這個程序我想就沒有分析的必要了，大家看一下就可以了。不明白可以在論壇上問。
MyData.h文件
///////////////////////////////////////////////////////
class CMyData
{
public:
  CMyData(int Index,char* strData);
  CMyData();
  virtual ~CMyData();

  int m_iIndex;
  int GetDataSize(){ return m_iDataSize; };
  const char* GetData(){ return m_strDatamember; };
  //這里重載了操作符：
  CMyData& operator =(CMyData &SrcData);
  bool operator <(CMyData& data );
  bool operator >(CMyData& data );

private:
  char* m_strDatamember;
  int m_iDataSize;
};
////////////////////////////////////////////////////////

MyData.cpp文件
////////////////////////////////////////////////////////
CMyData::CMyData():
m_iIndex(0),
m_iDataSize(0),
m_strDatamember(NULL)
{
}

CMyData::~CMyData()
{
  if(m_strDatamember != NULL)
    delete[] m_strDatamember;
  m_strDatamember = NULL;
}

CMyData::CMyData(int Index,char* strData):
m_iIndex(Index),
m_iDataSize(0),
m_strDatamember(NULL)
{
  m_iDataSize = strlen(strData);
  m_strDatamember = new char[m_iDataSize+1];
  strcpy(m_strDatamember,strData);
}

CMyData& CMyData::operator =(CMyData &SrcData)
{
  m_iIndex = SrcData.m_iIndex;
  m_iDataSize = SrcData.GetDataSize();
  m_strDatamember = new char[m_iDataSize+1];
  strcpy(m_strDatamember,SrcData.GetData());
  return *this;
}

bool CMyData::operator <(CMyData& data )
{
  return m_iIndex<data.m_iIndex;
}

bool CMyData::operator >(CMyData& data )
{
  return m_iIndex>data.m_iIndex;
}
///////////////////////////////////////////////////////////

//////////////////////////////////////////////////////////
//主程序部分
#include <iostream.h>
#include "MyData.h"

template <class T>
void run(T* pData,int left,int right)
{
  int i,j;
  T middle,iTemp;
  i = left;
  j = right;
  //下面的比較都調(diào)用我們重載的操作符函數(shù)
  middle = pData[(left+right)/2]; //求中間值
  do{
    while((pData[i]<middle) && (i<right))//從左掃描大于中值的數(shù)
      i++;
    while((pData[j]>middle) && (j>left))//從右掃描大于中值的數(shù)
      j--;
    if(i<=j)//找到了一對值
    {
      //交換
      iTemp = pData[i];
      pData[i] = pData[j];
      pData[j] = iTemp;
      i++;
      j--;
    }
  }while(i<=j);//如果兩邊掃描的下標(biāo)交錯，就停止（完成一次）

  //當(dāng)左邊部分有值(left<j)，遞歸左半邊
  if(left<j)
    run(pData,left,j);
  //當(dāng)右邊部分有值(right>i)，遞歸右半邊
  if(right>i)
    run(pData,i,right);
}

template <class T>
void QuickSort(T* pData,int Count)
{
  run(pData,0,Count-1);
}

void main()
{
  CMyData data[] = {
    CMyData(8,"xulion"),
    CMyData(7,"sanzoo"),
    CMyData(6,"wangjun"),
    CMyData(5,"VCKBASE"),
    CMyData(4,"jacky2000"),
    CMyData(3,"cwally"),
    CMyData(2,"VCUSER"),
    CMyData(1,"isdong")
  };
  QuickSort(data,8);
  for (int i=0;i<8;i++)
    cout<<data[i].m_iIndex<<" "<<data[i].GetData()<<"\n";
  cout<<"\n";
}

轉(zhuǎn)自：
http://blog.chinaunix.net/u/28584/showart.php?id=1211650

posted on 2009-11-23 21:27 chatler 閱讀(675) 評論(0) 編輯收藏引用所屬分類: Algorithm

只有注冊用戶登錄后才能發(fā)表評論。


相關(guān)文章: 從B 樹、B+ 樹、B* 樹談到R 樹《轉(zhuǎn)》 Which is asymptotically larger: lg(lg* n) or lg*(lg n)$? <> Doubly-linked list 利用斯特林公式求解n！ radix sort Google之Page Rank分析 Hash 算法及其應(yīng)用 Knuth–Morris–Pratt algorithm Hash Function related Trie樹\|字典樹的簡介及實(shí)現(xiàn)（轉(zhuǎn)）

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

<

2010年11月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

常用鏈接

留言簿(10)

隨筆分類(307)

隨筆檔案(297)

algorithm

andytan
algorithm, linux, os, network,etc
EXACT STRING MATCHING ALGORITHMS
httperf -- a web perf test tool
Java多線程
編程夜未眠
布薩空間
結(jié)構(gòu)之法
沈一峰 google技術(shù)博客
小兵的窩

Books_Free_Online

Book Fire Center

C++

Bjarne Stroustrup's C++ Style and Technique FAQ
boyplayee column
C Plus Plus
CPP Reference
LearnC++Website
Welcome to Bjarne Stroustrup's homepage!

database

mydear Database
mysql高性能筆記

Linux

獨(dú)孤閣

Linux shell

linux
飛翔

linux socket

linux socket programming
sock programming

misce

cloudward
感覺這個博客還是不錯，雖然做的東西和我不大相關(guān)，覺得看看還是有好處的

network

nginx

OSS

Google Android
Android is a software stack for mobile devices that includes an operating system, middleware and key applications. This early look at the Android SDK provides the tools and APIs necessary to begin developing applications on the Android platform using the Java programming language.
os161 file list

overall

linux related
linux_overall
loop_in_nodes
tiaot
Ubuntu Zone
陳皓專欄
享受編程的樂趣

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品