聚星亭

吾笨笨且懶散兮急須改之而奮進(jìn)

posts - 74, comments - 166, trackbacks - 0, articles - 0

[轉(zhuǎn)載]Radix Sort 的介紹 --------- 復(fù)雜度為O(n)的排序方法

Posted on 2009-03-27 17:53 besterChen 閱讀(3801) 評(píng)論(2) 編輯收藏引用

[聲明] 本文引用與：GameRes 游戲開發(fā)網(wǎng)

一.引言

前一段在http://www.allaboutprogram.com/上看到有關(guān)于排序方法的時(shí)間復(fù)雜度的研究，說的是在一般情況下，最好的時(shí)間復(fù)雜度是 O( n*LOG(n) )，而在特定的情況下，比如要排序的數(shù)據(jù)是整數(shù)，而且比較集中，也可以簡(jiǎn)化為 O(n)。

后來我也給abp寫了封信，說明了一下對(duì)于一般的整數(shù)（int 或者unsigned int），也可以進(jìn)行復(fù)雜度為 O(n)的排序。我后來給了他一個(gè)我寫的STL的版本，實(shí)現(xiàn)了復(fù)雜度為O(n)的int排序。但實(shí)測(cè)起來，至少在n = 1000*1024的時(shí)候，還是比STL的sort 要慢。

應(yīng)abp的要求，我寫了這篇文章，作為復(fù)雜度為O(n)的這種排序 ---- Radix Sort的介紹。今天，我在網(wǎng)上找到一小段代碼，和我寫的幾乎一樣，不過沒有用STL，實(shí)測(cè)性能在n =1024*1000的時(shí)候，VC 6 上 release 模式，排序時(shí)間：(tick)

n                         Radix Sort          STL Sort
100*1024                 20                     20
1000*1024             250                   320
4000*1024              991                  1513
10000*1024           2093                 3606

圖一是一張曲線圖，可見Radix Sort 的確可能比STL Sort 快，而且，因?yàn)镽adix Sort時(shí)間復(fù)雜度小，在更長的時(shí)間內(nèi)表現(xiàn)更為充分。這一點(diǎn)，在曲線圖里看得很清楚。n 從100* 1024增長到10000*1024，排序時(shí)間也從20 增長到2093，可以看出的確是O(n)的。

下面介紹一下Radix Sort 的算法。

二． Radix Sort 的簡(jiǎn)單算法

考慮一種簡(jiǎn)單情況，如果你給一些unsigned char 排序，除了教科書上的很多方法外，還有一種簡(jiǎn)單的。可以這樣考慮。試想排一系列的unsigned char, 值從0~ 255 ，放在 u_char data_array[ARRAY_SIZE] 中，分配一個(gè)數(shù)組 u_char membuffer[255];

for(int i=0;i<255;i++)
membuffer[i]=0;
for(int i=0;i<ARRAY_SIZE;i++)
membuffer[data_array[i]]++;

這樣，就把數(shù)字填到了membuffer內(nèi)部，然后，比如這個(gè)是輸出的數(shù)組

u_char sorted_array[ARRAY_SIZE];

int k=0;

for(int i=0;i<255;i++)
for(int j=0;j<membuffer[i]; j++)
sorted_array[k++]=i;

圖例：在256個(gè)entry的數(shù)組中，可能產(chǎn)生一系列的重復(fù)值。如下：

每個(gè)entry中實(shí)際并不記錄值，而是記錄重復(fù)的次數(shù)。

1 3 4 5 7

1 4
4

這樣，就把n = ARRAY_SIZE 的unsigned char 進(jìn)行了排序。

三.擴(kuò)展到int 的排序

那么，如何擴(kuò)展到對(duì)于一般的整數(shù)進(jìn)行排序呢？可以這樣考慮。一個(gè) int,是由?。磦€(gè)　char 組成（在32-bit int的系統(tǒng)上）在 Little Endian　字節(jié)順序（ Least Siginficant Byte first , 比如 80x86架構(gòu)?。┫拢?<- low memory address high memory address ->
char 0 char 1 char 2 char 3

如果是 0x12345678 那么

char 0 就是 0x78
char 1 就是 0x56
char 2 就是 0x34
char 3 就是 0x12

如果我們用最低位字節(jié)?。╟har 0）來作為 sort key對(duì)int 排序，然后使用次低做sort key, 然后用次高，最后用最高字節(jié)排序，實(shí)際的結(jié)果就是對(duì)整個(gè)int 進(jìn)行了排序。

下面的a, b, c, d指int 的不同char, 讓我們進(jìn)行一下升序排序(ascending sort)

abcd
bacd
dcba
caba
bbac

首先用最低位字節(jié)排序：

dcba
caba
bbac
abcd
bacd

然后用次低位：

bbac
dcba
caba
abcd
bacd

使用次高位：

caba
bacd
bbac
abcd
dcba

然后使用最高位字節(jié)排序：

abcd

bacd
bbac
caba
dcba

于是經(jīng)過四次排序，就得到了一個(gè)升序的int排序。

為了方便理解, 給出一個(gè)排int 的實(shí)際算法，這是我寫的STL版本的Radix Sort ,可以排任意多int，實(shí)際內(nèi)存占用并不太多。（沒有用2^32 的可怕的內(nèi)存量）

using namespace std;

typedef vector <int>  HASH;
typedef unsigned char  u_char;

HASH  hashtable[256];  //256 entries hash table

const int array_size=1024*4000;

void SortInt( int * data,  int size);

void SortIntByChar(int * data,  int size, int pos);

inline u_char GetHashvalue( int  value, int pos)
{
    return ((u_char*)&value)[pos];
}

void SortIntByChar(int * data,  int size, int pos)
{
    int i;

    //clear hashtable
    for(i=0;i<256; ++i)
    {
        hashtable[i].clear();
    }

    //add into hash table
    for(i=0;i< size; ++i)
    {
        hashtable[GetHashvalue(data[i],  pos)].push_back(data[i]);
    }

    //output int
    int k=0;

    if(pos!=3)
    {
        for(i=0;i< 256; ++i)
        {
            for(int j=0;j< hashtable[i].size(); ++j)
            {
                data[k++]=hashtable[i][j];
            }
        }
    }
    else  //most significant byte
    {
        for(i=128;i< 256; ++i)
        {
            for(int j=0;j< hashtable[i].size(); ++j)
            {
                data[k++]=hashtable[i][j];
            }
        }
        for(i=0;i< 128; ++i)
        {
            for(int j=0;j< hashtable[i].size(); ++j)
            {
                data[k++]=hashtable[i][j];
            }
        }
    }
}

void SortInt( int * data,  int size)
{
    SortIntByChar(data, size, 0);
    SortIntByChar(data, size, 1);
    SortIntByChar(data, size, 2);
    SortIntByChar(data, size, 3);
}

這里的方法，和前面說的最簡(jiǎn)單的并沒有太大不同，不同的是，因?yàn)閕nt是無法裝入char的數(shù)組的，所以，使用了一個(gè)vector<int> ，為256個(gè)entry中的任何一個(gè)。這樣，就把int的值裝入了。

經(jīng)過測(cè)試，這個(gè)效果并不太好，對(duì)于n=1000*1024下為500 ticks ，比 STL Sort 的　320 ticks要慢。那么，前面的250 ticks 如何得來的呢？這就是有關(guān)優(yōu)化的問題。使用了STL，所以慢。因?yàn)樵?clear()　和push_back（）中，作了過多你在這里不關(guān)心的事情。這里給出上面測(cè)試用的快速版本，未使用STL

void radix (int byte, long N, const long *source, long *dest)
{
    long count[256];
    long index[256];

    memset (count, 0, sizeof (count));

    for ( int i=0; i<N; ++i ) ++count[((source[i])>>(byte*8))&0xff];

    if(byte!=3)
    {
        index[0]=0;
        for ( i=1; i<256; ++i ) index[i]=index[i-1]+count[i-1];
    }
    else
    {
        index[128]=0;

        for ( i=128+1; i<256; ++i )  index[i]=index[i-1]+count[i-1];

        index[0]=index[255]+count[255];

        for ( i=1; i<128; ++i ) index[i]=index[i-1]+count[i-1];
    }

    for ( i=0; i<N; ++i ) dest[index[((source[i])>>(byte*8))&0xff]++] = source[i];
}

void radixsort (long *source, long *temp, long N)
{
    radix (0, N, source, temp);
    radix (1, N, temp, source);
    radix (2, N, source, temp);
    radix (3, N, temp, source);
}

不同的是，他多用了一個(gè)index數(shù)組來記錄每一個(gè)entry的開始的對(duì)應(yīng)于全體數(shù)據(jù)的index. 這樣，就不必使用STL 的vector。

這個(gè)版本的作者是Nils Pipenbrinck aka ，是我從網(wǎng)上找到的，本來是排unsigned long的，被我改成了 signed long 。

四.擴(kuò)展到float 的排序

圖二是IEEE 754 規(guī)范中單精度 float的格式：即VC 中的float。

在這里只討論float，不討論double。最高位(bit 31) 是符號(hào)位，如果為1，則表示為負(fù)，為0則為非負(fù)。Exp 有8位，是表示指數(shù)部分的，Significand 是小數(shù)部分。在把十進(jìn)制表示的浮點(diǎn)數(shù)生成IEEE754各部分的時(shí)候，還有一些normalize 等操作，比較麻煩。因?yàn)檫@里主要討論排序，所以不仔細(xì)說了。

但有幾點(diǎn)可以這樣看：

負(fù)數(shù)小于正數(shù)，正數(shù)的絕對(duì)值越大值越大，負(fù)數(shù)相反。對(duì)于正數(shù)，指數(shù)大的肯定大。相同的指數(shù)，尾數(shù)大的更大。這樣，也可以強(qiáng)行比較字節(jié)，從低字節(jié)開始比?？墒堑谌齻€(gè)字節(jié)的最高位(bit23)有1位實(shí)際上是exp的最低位。

可以這樣想，假設(shè) A 和B 是兩個(gè)正的float，A. bit 23代表A的第23位，那么：

Title

if ( A . bit 23 > B. bit 23 ) , then A >B 成立

if(A.bit 23< B. bit 23) , then A<B 成立。

那么，把指數(shù)的最低位放到和尾數(shù)一起組成的字節(jié)比較仍然可以比出浮點(diǎn)數(shù)的大小來。最后一次比較，最高字節(jié)的最高位是符號(hào)位。這可以特別處理。所以，比較浮點(diǎn)數(shù)和比較int 并沒有太大的不同，就是有些符號(hào)處理的問題要注意。

Pierre Terdiman 給出了排序float的算法。測(cè)試結(jié)果和STL排序float比較一下，如下：

N                      Radix Sort (float)        STL Sort (float)
100*1024                30                                  30
1000*1024             641                                431
4000*1024            2334                             1903
10000*1024          5788                             5498

（圖三）

可以看出，至少在n=10000*1024的范圍里，Pierre Terdiman 的Radix Sort 方法還是比 STL sort 要慢。但我測(cè)了一下Pierre Terdiman 的int 排序，也是比STL sort慢。推測(cè)可能是他的算法優(yōu)化不夠。從道理上講，的確是O(n) 的復(fù)雜度，就是N 不是充分大的時(shí)候體現(xiàn)不出來。

我曾看過在一個(gè)Nvidia 的工具的source code，據(jù)稱是最好的float 排序，但現(xiàn)在不在手邊。等我找到了也加上來。不同的source code的算法倒是基本上一樣，就是優(yōu)化的程度不同。但小小的優(yōu)化帶來的結(jié)果也可能是顯著的。

五．源代碼和參考資料
         列出我寫的整數(shù)排序方法，
         Nils Pipenbrinck aka 的整數(shù)排序方法,
         和 Pierre Terdiman的整數(shù)和浮點(diǎn)排序方法。
         “Radix Sort Tutorial” by Nils：http://www.allaboutprogram.com/RadixSortRevisited.mht

“Radix Sort Revisited” by Pierre Terdiman：http://www.allaboutprogram.com/RadixSortTutorial.mht

Feedback

# re: [轉(zhuǎn)載]Radix Sort 的介紹 --------- 復(fù)雜度為O(n)的排序方法 [未登錄] 回復(fù) 更多評(píng)論

2011-03-15 23:51 by a

Quick sort之所以快，是因?yàn)樗浅Ｖ甤ache-friendly，遠(yuǎn)比radix sort好得多……

刷新評(píng)論列表

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。




網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

聚星亭

[轉(zhuǎn)載]Radix Sort 的介紹 --------- 復(fù)雜度為O(n)的排序方法

Feedback

# re: [轉(zhuǎn)載]Radix Sort 的介紹 --------- 復(fù)雜度為O(n)的排序方法 [未登錄] 回復(fù) 更多評(píng)論

公告

隨筆分類(81)

隨筆檔案(74)

牛人博客

團(tuán)隊(duì)博客

友情鏈接

知名論壇

最新隨筆

搜索

積分與排名

最新評(píng)論

閱讀排行榜

評(píng)論排行榜