在多進程(線程)訪問資源時,能夠確保所有其他的進程(線程)都不在同一時間內訪問相同的資源。
原子操作:UP和SMP的異同
-----------------------------------------------------------
原子操作是不可分割的,在執行完畢不會被任何其它任務或事件中斷。在單處理器系統(UniProcessor)中,能夠在單條指令中完成的操作都可以認為是" 原子操作",因為中斷只能發生于指令之間。這也是某些CPU指令系統中引入了test_and_set、test_and_clear等指令用于臨界資源互斥的原因。但是,在對稱多處理器(Symmetric Multi-Processor)結構中就不同了,由于系統中有多個處理器在獨立地運行,即使能在單條指令中完成的操作也有可能受到干擾。我們以decl (遞減指令)為例,這是一個典型的"讀-改-寫"過程,涉及兩次內存訪問。設想在不同CPU運行的兩個進程都在遞減某個計數值,可能發生的情況是:
1. CPU A(CPU A上所運行的進程,以下同)從內存單元把當前計數值(2)裝載進它的寄存器中;
2. CPU B從內存單元把當前計數值(2)裝載進它的寄存器中。
3. CPU A在它的寄存器中將計數值遞減為1;
4. CPU B在它的寄存器中將計數值遞減為1;
5. CPU A把修改后的計數值(1)寫回內存單元。
6. CPU B把修改后的計數值(1)寫回內存單元。
我們看到,內存里的計數值應該是0,然而它卻是1。如果該計數值是一個共享資源的引用計數,每個進程都在遞減后把該值與0進行比較,從而確定是否需要釋放該共享資源。這時,兩個進程都去掉了對該共享資源的引用,但沒有一個進程能夠釋放它--兩個進程都推斷出:計數值是1,共享資源仍然在被使用。
原子性不可能由軟件單獨保證--必須需要硬件的支持,因此是和架構相關的。在x86 平臺上,CPU提供了在指令執行期間對總線加鎖的手段。CPU芯片上有一條引線#HLOCK pin,如果匯編語言的程序中在一條指令前面加上前綴"LOCK",經過匯編以后的機器代碼就使CPU在執行這條指令的時候把#HLOCK pin的電位拉低,持續到這條指令結束時放開,從而把總線鎖住,這樣同一總線上別的CPU就暫時不能通過總線訪問內存了,保證了這條指令在多處理器環境中的原子性。
Linux內核中的原子操作
-----------------------------------------------------------
原子操作大部分使用匯編語言實現,因為c語言并不能實現這樣的操作。
* 在x86的原子操作實現代碼中,定義了LOCK宏,這個宏可以放在隨后的內聯匯編指令之前。如果是SMP,LOCK宏被擴展為lock指令;否則被定義為空 -- 單CPU無需防止其它CPU的干擾,鎖內存總線完全是在浪費時間。
#ifdef CONFIG_SMP
#define LOCK "lock ; "
#else
#define LOCK ""
#endif
* typedef struct { volatile int counter; } atomic_t;
在所有支持的體系結構上原子類型atomic_t都保存一個int值。在x86的某些處理器上,由于工作方式的原因,原子類型能夠保證的可用范圍只有24位。volatile是一個類型描述符,要求編譯器不要對其描述的對象作優化處理,對它的讀寫都需要從內存中訪問。
* #define ATOMIC_INIT(i) { (i) }
用于在定義原子變量時,初始化為指定的值。如:
static atomic_t count = ATOMIC_INIT(1);
* static __inline__ void atomic_add(int i, atomic_t *v)
----------------------------------------
將v指向的原子變量加上i。該函數不關心原子變量的新值,返回void類型。
在下面的實現中,使用了帶有C/C++表達式的內聯匯編代碼,格式如下(參考《AT&T ASM Syntax》):
__asm__ __volatile__("Instruction List" : Output : Input : Clobber/Modify);
__asm__ __volatile__指示編譯器原封不動保留表達式中的匯編指令系列,不要考慮優化處理。涉及的約束還包括:
1. 等號約束(=):只能用于輸出操作表達式約束,說明括號內的左值表達式v->counter是write-only的。
2. 內存約束(m):表示使用不需要借助寄存器,直接使用內存方式進行輸入或輸出。
3. 立即數約束(i):表示輸入表達式是一個立即數(整數),不需要借助任何寄存器。
4. 寄存器約束(r):表示使用一個通用寄存器,由GCC在%eax/%ax/%al、%ebx/%bx/%bl、%ecx/%cx/%cl和%edx/%dx/%dl中選取一個合適的。
{
__asm__ __volatile__(
LOCK "addl %1,%0"
:"=m" (v->counter)
:"ir" (i), "m" (v->counter));
}
* static __inline__ int atomic_sub_and_test(int i, atomic_t *v)
----------------------------------------
從v 指向的原子變量減去i,并測試是否為0。若為0,返回真,否則返回假。由于x86的subl指令會在結果為0時設置CPU的zero標志位,而且這個標志位是CPU私有的,不會被其它CPU影響。因此,可以執行一次加鎖的減操作,再根據CPU的zero標志位來設置本地變量c,并相應返回。
{
unsigned char c;
__asm__ __volatile__(
LOCK "subl %2,%0; sete %1"
:"=m" (v->counter), "=qm" (c)
:"ir" (i), "m" (v->counter) : "memory");
return c;
}
------------------------------------
#define atomic_read(v) ((v)->counter)
讀取v指向的原子變量的值。由于該操作本身就是原子的,只需要一次內存訪問就能完成,因此定義為一個宏,并用C代碼實現。
#define atomic_set(v,i) (((v)->counter) = (i))
設置v指向的原子變量的值為i。由于該操作本身就是原子的,只需要一次內存訪問就能完成,因此定義為一個宏,并用C代碼實現。
static __inline__ void atomic_sub(int i, atomic_t *v)
從v指向的原子變量減去i。
static __inline__ void atomic_inc(atomic_t *v)
遞增v指向的原子變量。
static __inline__ void atomic_dec(atomic_t *v)
遞減v指向的原子變量。
static __inline__ int atomic_dec_and_test(atomic_t *v)
遞減v指向的原子變量,并測試是否為0。若為0,返回真,否則返回假。
static __inline__ int atomic_inc_and_test(atomic_t *v)
遞增v指向的原子變量,并測試是否為0。若為0,返回真,否則返回假。
static __inline__ int atomic_add_negative(int i, atomic_t *v)
將v指向的原子變量加上i,并測試結果是否為負。若為負,返回真,否則返回假。這個操作用于實現semaphore。