牽著老婆滿街逛

嚴(yán)以律己,寬以待人. 三思而后行.
GMail/GTalk: yanglinbo#google.com;
MSN/Email: tx7do#yahoo.com.cn;
QQ: 3 0 3 3 9 6 9 2 0 .

導(dǎo)航

<

2015年1月

>

日

一

二

三

四

五

六

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

6

7

統(tǒng)計

隨筆 - 1513
文章 - 45
評論 - 907
引用 - 0

公告

言論：
1.每日自省；
2.享受人生；
3.盡力而為；
4.堅持不懈；
5.切莫急躁；
6.慎言敏行；
7.動心忍性；
8.上善若水。

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

搜索

積分與排名

積分 - 2523936
排名 - 2

閱讀排行榜

無鎖(lock-free)數(shù)據(jù)結(jié)構(gòu)

轉(zhuǎn)載自：http://www.limodev.cn/blog/archives/494

系統(tǒng)程序員成長計劃-并發(fā)(五)

轉(zhuǎn)載時請注明出處和作者聯(lián)系方式
文章出處：http://www.limodev.cn/blog
作者聯(lián)系方式：李先靜 <xianjimli@gmail.com>

無鎖(lock-free)數(shù)據(jù)結(jié)構(gòu)

提到并行計算通常都會想到加鎖，事實卻并非如此，大多數(shù)并發(fā)是不需要加鎖的。比如在不同電腦上運行的代碼編輯器，兩者并發(fā)運行不需要加鎖。在一臺電腦上同時運行的媒體播放放器和代碼編輯器，兩者并發(fā)運行不需要加鎖(當(dāng)然系統(tǒng)調(diào)用和進程調(diào)度是要加鎖的)。在同一個進程中運行多個線程，如果各自處理獨立的事情也不需要加鎖(當(dāng)然系統(tǒng)調(diào)用、進程調(diào)度和內(nèi)存分配是要加鎖的)。在以上這些情況里，各個并發(fā)實體之間沒有共享數(shù)據(jù)，所以雖然并發(fā)運行但不需要加鎖。

多線程并發(fā)運行時，雖然有共享數(shù)據(jù)，如果所有線程只是讀取共享數(shù)據(jù)而不修改它，也是不用加鎖的，比如代碼段就是共享的“數(shù)據(jù)”，每個線程都會讀取，但是不用加鎖。排除所有這些情況，多線程之間有共享數(shù)據(jù)，有的線程要修改這些共享數(shù)據(jù)，有的線程要讀取這些共享數(shù)據(jù)，這才是程序員需要關(guān)注的情況，也是本節(jié)我們討論的范圍。

在并發(fā)的環(huán)境里，加鎖可以保護共享的數(shù)據(jù)，但是加鎖也會存在一些問題：

由于臨界區(qū)無法并發(fā)運行，進入臨界區(qū)就需要等待，加鎖帶來效率的降低。
在復(fù)雜的情況下，很容易造成死鎖，并發(fā)實體之間無止境的互相等待。
在中斷/信號處理函數(shù)中不能加鎖，給并發(fā)處理帶來困難。
優(yōu)先級倒置造成實時系統(tǒng)不能正常工作。低級優(yōu)先進程拿到高優(yōu)先級進程需要的鎖，結(jié)果是高/低優(yōu)先級的進程都無法運行，中等優(yōu)先級的進程可能在狂跑。

由于并發(fā)與加鎖(互斥)的矛盾關(guān)系，無鎖數(shù)據(jù)結(jié)構(gòu)自然成為程序員關(guān)注的焦點，這也是本節(jié)要介紹的：

CPU提供的原子操作

大約在七八年前，我們用apache的xerces來解析XML文件，奇怪的是多線程反而比單線程慢。他們找了很久也沒有找出原因，只是證實使用多進程代替多線程會快一個數(shù)量級，在Windows上他們就使用了多進程的方式。后來移植到linux時候，我發(fā)現(xiàn)xerces每創(chuàng)建一個結(jié)點都會去更新一些全局的統(tǒng)計信息，比如把結(jié)點的總數(shù)加一，它使用的pthread_mutex實現(xiàn)互斥。這就是問題所在：一個XML文檔有數(shù)以萬計的結(jié)點，以50個線程并發(fā)為例，每個線程解析一個XML文檔，總共要進行上百萬次的加鎖/解鎖，幾乎所有線程都在等待，你說能快得了嗎？

當(dāng)時我知道Windows下有InterlockedIncrement之類的函數(shù)，它們利用CPU一些特殊指令，保證對整數(shù)的基本操作是原子的。查找了一些資源發(fā)現(xiàn)Linux下也有類似的函數(shù)，后來我把所有加鎖去掉，換成這些原子操作，速度比多進程運行還快了幾倍。下面我們看++和—的原子操作在IA架構(gòu)上的實現(xiàn)：

#define ATOMIC_SMP_LOCK "lock ; "

typedef struct { volatile int counter; } atomic_t;

static __inline__ void atomic_inc(atomic_t *v)

{

__asm__ __volatile__(

ATOMIC_SMP_LOCK "incl %0"

:"=m" (v->counter)

:"m" (v->counter));

}

static __inline__ void atomic_dec(atomic_t *v)

{

__asm__ __volatile__(

ATOMIC_SMP_LOCK "decl %0"

:"=m" (v->counter)

:"m" (v->counter));

}

單入單出的循環(huán)隊列。單入單出的循環(huán)隊列是一種特殊情況，雖然特殊但是很實用，重要的是它不需要加鎖。這里的單入是指只有一個線程向隊列里追加數(shù)據(jù)(push)，單出只是指只有一個線程從隊列里取數(shù)據(jù)(pop)，循環(huán)隊列與普通隊列相比，不同之處在于它的最大數(shù)據(jù)儲存量是事先固定好的，不能動態(tài)增長。盡管有這些限制它的應(yīng)用還是相當(dāng)廣泛的。這我們介紹一下它的實現(xiàn)：

數(shù)據(jù)下定義如下：

typedef struct _FifoRing

{

int r_cursor;

int w_cursor;

size_t length;

void* data[0];

}FifoRing;

r_cursor指向隊列頭，用于取數(shù)據(jù)(pop)。w_cursor指向隊列尾，用于追加數(shù)據(jù)(push)。length表示隊列的最大數(shù)據(jù)儲存量，data表示存放的數(shù)據(jù)，[0]在這里表示變長的緩沖區(qū)(前面我們已經(jīng)講過)。

創(chuàng)建函數(shù)

FifoRing* fifo_ring_create(size_t length)

{

FifoRing* thiz = NULL;

return_val_if_fail(length > 1, NULL);

thiz = (FifoRing*)malloc(sizeof(FifoRing) + length * sizeof(void*));

if(thiz != NULL)

{

thiz->r_cursor = 0;

thiz->w_cursor = 0;

thiz->length = length;

}

return thiz;

}

這里我們要求隊列的長度大于1而不是大于0，為什么呢？排除長度為1的隊列沒有什么意義的原因外，更重要的原因是隊列頭與隊列尾重疊 (r_cursor= =w_cursor) 時，到底表示是滿隊列還是空隊列？這個要搞清楚才行，上次一個同事犯了這個錯誤，讓我們查了很久。這里我們認(rèn)為隊列頭與隊列尾重疊時表示隊列為空，這與隊列初始狀態(tài)一致，后面在寫的時候始終保留一個空位，避免隊列頭與隊列尾重疊，這樣可以消除歧義了。

追加數(shù)據(jù)(push)

Ret fifo_ring_push(FifoRing* thiz, void* data)

{

int w_cursor = 0;

Ret ret = RET_FAIL;

return_val_if_fail(thiz != NULL, RET_FAIL);

w_cursor = (thiz->w_cursor + 1) % thiz->length;

if(w_cursor != thiz->r_cursor)

{

thiz->data[thiz->w_cursor] = data;

thiz->w_cursor = w_cursor;

ret = RET_OK;

}

return ret;

}

隊列頭和隊列尾之間還有一個以上的空位時就追加數(shù)據(jù)，否則返回失敗。

取數(shù)據(jù)(pop)

Ret fifo_ring_pop(FifoRing* thiz, void** data)

{

Ret ret = RET_FAIL;

return_val_if_fail(thiz != NULL && data != NULL, RET_FAIL);

if(thiz->r_cursor != thiz->w_cursor)

{

*data = thiz->data[thiz->r_cursor];

thiz->r_cursor = (thiz->r_cursor + 1)%thiz->length;

ret = RET_OK;

}

return ret;

}

隊列頭和隊列尾不重疊表示隊列不為空，取數(shù)據(jù)并移動隊列頭。

單寫多讀的無鎖數(shù)據(jù)結(jié)構(gòu)
單寫表示只有一個線程去修改共享數(shù)據(jù)結(jié)構(gòu)，多讀表示有多個線程去讀取共享數(shù)據(jù)結(jié)構(gòu)。前面介紹的讀寫鎖可以有效的解決這個問題，但更高效的辦法是使用無鎖數(shù)據(jù)結(jié)構(gòu)。思路如下：

就像為了避免顯示閃爍而使用的雙緩沖一樣，我們使用兩份數(shù)據(jù)結(jié)構(gòu)，一份數(shù)據(jù)結(jié)構(gòu)用于讀取，所有線程都可以在不加鎖的情況下讀取這個數(shù)據(jù)結(jié)構(gòu)。另外一份數(shù)據(jù)結(jié)構(gòu)用于修改，由于只有一個線程會修改它，所以也不用加鎖。

在修改之后，我們再交換讀/寫的兩個函數(shù)結(jié)構(gòu)，把另外一份也修改過來，這樣兩個數(shù)據(jù)結(jié)構(gòu)就一致了。在交換時要保證沒有線程在讀取，所以我們還需要一個讀線程的引用計數(shù)。現(xiàn)在我們看看怎么把前面寫的雙向鏈表改為單寫多讀的無鎖數(shù)據(jù)結(jié)構(gòu)。

為了保證交換是原子的，我們需要一個新的原子操作CAS(compare and swap)。

#define CAS(_a, _o, _n) \

({ __typeof__(_o) __o = _o; \

__asm__ __volatile__( \

"lock cmpxchg %3,%1" \

: "=a" (__o), "=m" (*(volatile unsigned int *)(_a)) \

: "0" (__o), "r" (_n) ); \

__o; \

})

數(shù)據(jù)結(jié)構(gòu)

typedef struct _SwmrDList

{

atomic_t rd_index_and_ref;

DList* dlists[2];

}SwmrDList;

兩個鏈表，一個用于讀一個用于寫。rd_index_and_ref的最高字節(jié)記錄用于讀取的雙向鏈表的索引，低24位用于記錄讀取線程的引用記數(shù)，最大支持16777216個線程同時讀取，應(yīng)該是足夠了，所以后面不考慮它的溢出。

讀取操作

int swmr_dlist_find(SwmrDList* thiz, DListDataCompareFunc cmp, void* ctx)

{

int ret = 0;

return_val_if_fail(thiz != NULL && thiz->dlists != NULL, -1);

atomic_inc(&(thiz->rd_index_and_ref));

size_t rd_index = (thiz->rd_index_and_ref.counter>>24) & 0x1;

ret = dlist_find(thiz->dlists[rd_index], cmp, ctx);

atomic_dec(&(thiz->rd_index_and_ref));

return ret;

}

修改操作

Ret swmr_dlist_insert(SwmrDList* thiz, size_t index, void* data)

{

Ret ret = RET_FAIL;

DList* wr_dlist = NULL;

return_val_if_fail(thiz != NULL && thiz->dlists != NULL, ret);

size_t wr_index = !((thiz->rd_index_and_ref.counter>>24) & 0x1);

if((ret = dlist_insert(thiz->dlists[wr_index], index, data)) == RET_OK)

{

int rd_index_old = thiz->rd_index_and_ref.counter & 0xFF000000;

int rd_index_new = wr_index << 24;

do

{

usleep(100);

}while(CAS(&(thiz->rd_index_and_ref), rd_index_old, rd_index_new));

wr_index = rd_index_old>>24;

ret = dlist_insert(thiz->dlists[wr_index], index, data);

}

return ret;

}

先修改用于修改的雙向鏈表，修改完成之后等到?jīng)]有線程讀取時，交換讀/寫兩個鏈表，再修改另一個鏈表，此時兩個鏈表狀態(tài)保持一致。

稍做改進，對修改的操作進行加鎖，就可以支持多讀多寫的數(shù)據(jù)結(jié)構(gòu)，讀是無鎖的，寫是加鎖的。

真正的無鎖數(shù)據(jù)結(jié)構(gòu)
Andrei Alexandrescu的《Lock-FreeDataStructures》估計是這方面最經(jīng)典的論文了，對他的方法我開始感到驚奇后來感到失望，驚奇的是算法的巧妙，失望的是無鎖的限制和代價。作者最后說這種數(shù)據(jù)結(jié)構(gòu)只適用于WRRMBNTM(Write-Rarely-Read-Many -But-Not-Too-Many)的情況。而且每次修改都要拷貝整個數(shù)據(jù)結(jié)構(gòu)（甚至多次），所以不要指望這種方法能帶來多少性能上的提高，唯一的好處是能避免加鎖帶來的部分副作用。有興趣的朋友可以看下這篇論文，這里我就不重復(fù)了。

本節(jié)示例請到這里下載。

posted on 2010-10-31 16:16 楊粼波閱讀(1314) 評論(0) 編輯收藏引用

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

牽著老婆滿街逛

導(dǎo)航

統(tǒng)計

公告

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

工具官網(wǎng)

技術(shù)網(wǎng)站

開源網(wǎng)站

其他窩點

收藏網(wǎng)站

銀行官網(wǎng)

友情鏈接

資源共享

搜索

積分與排名

最新評論

閱讀排行榜

無鎖(lock-free)數(shù)據(jù)結(jié)構(gòu)

系統(tǒng)程序員成長計劃-并發(fā)(五)