最近在看操作系統方面的東西,然后看到一些同步的要求,比如鎖,于是就想想它們是如何實現的?
比如應用層編碼是調用EnterCriticalSection之類的,以前就想到這里,剩下的工作就由OS去管理了,反正它能實現;不過今天一想,它能有什么辦法呢?如果是軟件它貌似也沒有什么比應用層強的方法;于是有點好奇,就查閱一些資料來研究一下究竟。
一般的鎖實現都是通過處理器支持的原子操作來完成的,這些原子操作是不可分割的,不能被中斷。在單處理器的CPU上,單條指令可以認為是原子操作,因為中斷只能發生在指令之間。但對于多處理器結構就不一樣了,這個時候需要一些硬件的支持來保證,這嚴重依賴于不同的硬件實現。
例如:x86平臺上,CPU執行期間會對總線加鎖的手段,也就是CPU芯片上有一個HLOCK Pin,可以通過發送指令來操作,將#HLOCK pin電位拉低,并持續到這條指令執行完畢,從而將總線鎖定,因此同一個總線的其他CPU就不能通過總線來訪存了,因此保證了這條指令在多處理器環境下的原子性。
最開始的時候這些功能是用于CPU測試使用,但最后被操作系統實現而封裝成各種功能:關鍵代碼段、信號量等。因此在應用層使用來說脫離了與不同硬件交互的過程。
這里看一個X86平臺windows上的一個關鍵代碼段實現。
原來代碼如下:
1
int _tmain(int argc, _TCHAR* argv[])
2

{
3
CRITICAL_SECTION cs;
4
InitializeCriticalSection(&cs);
5
6
EnterCriticalSection(&cs);
7
int i =0;
8
i++;
9
LeaveCriticalSection(&cs);
10
return 0;
11
} 反匯編到EnterCriticalSection,可以看到如下代碼:
1
77BD69D0 push ebp
2
77BD69D1 mov ebp,esp
3
77BD69D3 sub esp,0Ch
4
77BD69D6 push esi
5
77BD69D7 push edi
6
77BD69D8 mov edi,dword ptr [ebp+8]
7
77BD69DB lea esi,[edi+4]
8
77BD69DE mov eax,esi
9
77BD69E0 lock btr dword ptr [eax],0
10
77BD69E5 jae 77BE5F4B
11
77BD69EB mov eax,dword ptr fs:[00000018h] 這里特別需要注意: lock btr dword ptr[eax], 0
lock是一個指令前綴,Intel的手冊上對其的解釋是:
Causes the processor's LOCK# signal to be asserted during execution of the accompanying instruction (turns the instruction into an atomic instruction). In a multiprocessor environment, the LOCK# signal insures that the processor has exclusive use of any shared memory while the signal is asserted.
也就是說lock會使緊跟在其后面的指令變成 atomic instruction。暫時的鎖一下總線,指令執行完了,總線就解鎖了.
從上面可以看到其驗證了前面所說;到這里就算是理解了操作系統是如何實現鎖機制的。