一区二区三区在线免费播放,久久精品中文字幕免费mv,亚洲精品国产精品久久清纯直播

內核同步機制-優化屏障和內存屏障

轉載自：http://blog.csdn.net/erazy0/article/details/6210569

優化屏障

編譯器編譯源代碼時，會將源代碼進行優化，將源代碼的指令進行重排序，以適合于CPU的并行執行。然而，內核同步必須避免指令重新排序，優化屏障（Optimization barrier）避免編譯器的重排序優化操作，保證編譯程序時在優化屏障之前的指令不會在優化屏障之后執行。
Linux用宏barrier實現優化屏障，gcc編譯器的優化屏障宏定義列出如下（在include/linux/compiler-gcc.h中）：

#define barrier() __asm__ __volatile__("": : :"memory")

上述定義中，“__asm__”表示插入了匯編語言程序，“__volatile__”表示阻止編譯器對該值進行優化，確保變量使用了用戶定義的精確地址，而不是裝有同一信息的一些別名。“memory”表示指令修改了內存單元。

內存屏障

軟件可通過讀寫屏障強制內存訪問次序。讀寫屏障像一堵墻，所有在設置讀寫屏障之前發起的內存訪問，必須先于在設置屏障之后發起的內存訪問之前完成，確保內存訪問按程序的順序完成。
讀寫屏障通過處理器構架的特殊指令mfence（內存屏障）、lfence（讀屏障）和sfence（寫屏障）完成，見《x86-64構架規范》一章。另外，在x86-64處理器中，對硬件進行操作的匯編語言指令是“串行的”，也具有內存屏障的作用，如：對I/O端口進行操作的所有指令、帶lock前綴的指令以及寫控制寄存器、系統寄存器或調試寄存器的所有指令（如：cli和sti）。
Linux內核提供的內存屏障API函數說明如表2。內存屏障可用于多處理器和單處理器系統，如果僅用于多處理器系統，就使用smp_xxx函數，在單處理器系統上，它們什么都不要。
表2 內存屏障API函數說明

內存屏障的宏定義	功能說明
mb()	適用于多處理器和單處理器的內存屏障。
rmb()	適用于多處理器和單處理器的讀內存屏障。
wmb()	適用于多處理器和單處理器的寫內存屏障。
smp_mb()	適用于多處理器的內存屏障。
smp_rmb()	適用于多處理器的讀內存屏障。
smp_wmb()	適用于多處理器的寫內存屏障。

適合于多處理器和單處理器的內存屏障宏定義列出如下（在include/asm-x86/system.h中）：

#ifdef CONFIG_X86_32

/*指令“lock; addl $0,0(%%esp)”表示加鎖，把0加到棧頂的內存單元，該指令操作本身無意義，但這些指令起到內存屏障的作用，讓前面的指令執行完成。具有XMM2特征的CPU已有內存屏障指令，就直接使用該指令*/

#define mb() alternative("lock; addl $0,0(%%esp)", "mfence", X86_FEATURE_XMM2)

#define rmb() alternative("lock; addl $0,0(%%esp)", "lfence", X86_FEATURE_XMM2)

#define wmb() alternative("lock; addl $0,0(%%esp)", "sfence", X86_FEATURE_XMM)

#else

#define mb() asm volatile("mfence":::"memory")

#define rmb() asm volatile("lfence":::"memory")

#define wmb() asm volatile("sfence" ::: "memory")

#endif

/*刷新后面的讀所依賴的所有掛起讀操作，在x86-64構架上不需要*/

#define read_barrier_depends() do { } while (0)

宏定義ead_barrier_depends()刷新后面的讀所依賴的所有掛起讀操作，后面的讀操作依賴于正處理的讀操作返回的數據。在x86-64構架上不需要此宏。它表明：在此屏障之前，沒有來自內存區域數據所依賴的讀曾經重排序。所有的讀操作處理此原語，保證在跟隨此原語的任何讀操作此原語之前訪問內存（但不需要其他CPU的cache）。此原語在大多數CPU上有比rmb()更輕的份量。
本地CPU和編譯器遵循內存屏障的排序限制，僅內存屏障原語保證排序，即使數據有依賴關系，也不能保證排序。例如：下面代碼將強迫排序，因為*q的讀操作依賴于p的讀操作，并且這兩個讀操作被read_barrier_depends()分開。在CPU 0和CPU 1上執行的程序語句分別列出如下：

CPU 0 CPU 1

b = 2;

memory_barrier();

p = &b; q = p;

read_barrier_depends();

d = *q;

下面的代碼沒有強制排序，因為在a和b的讀操作之間沒有依賴關系，因此，在一些CPU上，如：Alpha，y將設置為3，x設置為0。類似這種沒有數據依賴關系的讀操作，需要排序應使用rmb()。

CPU 0 CPU 1

a = 2;

memory_barrier();

b = 3; y = b;

read_barrier_depends();

x = a;

適合于多處理器的內存屏障宏定義列出如下（在include/asm-x86/system.h中）：

#ifdef CONFIG_SMP

#define smp_mb() mb()

#ifdef CONFIG_X86_PPRO_FENCE

# define smp_rmb() rmb()

#else

# define smp_rmb() barrier()

#endif

#ifdef CONFIG_X86_OOSTORE

# define smp_wmb() wmb()

#else

# define smp_wmb() barrier()

#endif

#define smp_read_barrier_depends() read_barrier_depends()

#define set_mb(var, value) do { (void)xchg(&var, value); } while (0)

#else

#define smp_mb() barrier()

#define smp_rmb() barrier()

#define smp_wmb() barrier()

#define smp_read_barrier_depends() do { } while (0)

#define set_mb(var, value) do { var = value; barrier(); } while (0)

#endif

函數rdtsc_barrier用于加內存屏障阻止RDTSC猜測，當在一個定義的代碼區域使用讀取時間戳計數器（Read Time-Stamp Counter，RDTSC）函數（或者函數get_cycles或vread）時，必須加內存屏障阻止RDTSC猜測。其列出如下：

static inline void rdtsc_barrier(void)

{

alternative(ASM_NOP3, "mfence", X86_FEATURE_MFENCE_RDTSC);

alternative(ASM_NOP3, "lfence", X86_FEATURE_LFENCE_RDTSC);

}

posted on 2011-08-30 14:17 楊粼波閱讀(1110) 評論(0) 編輯收藏引用所屬分類: C++

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: VS2015編譯Android版Cocos項目所踩的那些坑 linux使用msgpack及測試 msgpack[C++]使用筆記和 msgpack/cPickle性能對比 Twitter Snowflake 網游服務器中的GUID(唯一標識碼)實現-基于snowflake算法求最大公約數的3個實現字節對齊（強制對齊以及自然對齊）使用libcurl實現的上傳器窗口大小控制MINMAXINFO 對Windows下的File Mapping一個簡單的封裝

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

牽著老婆滿街逛

導航

統計

公告

常用鏈接

留言簿(11)

隨筆分類(466)

隨筆檔案(1513)

文章分類(46)

文章檔案(45)

相冊

收藏夾(39)

工具官網

技術網站

開源網站

其他窩點

收藏網站

銀行官網

友情鏈接

資源共享

搜索

積分與排名

最新評論

閱讀排行榜

內核同步機制-優化屏障和內存屏障

優化屏障

內存屏障