與“soft affinity”相對(duì)的是“hard affiinty”(硬相關(guān)),使用它可以控制哪個(gè)CPU運(yùn)行哪些線程。
在系統(tǒng)引導(dǎo)的時(shí)候,系統(tǒng)決定該計(jì)算機(jī)中有幾個(gè)CPU可以被使用。在應(yīng)用程序中,可以呼叫GetSystemInfo函數(shù)來取得CPU的數(shù)量。
一般地,線程可以運(yùn)行在任何一個(gè)CPU上,當(dāng)然,你可以使用Windows自帶的“soft affinity”機(jī)制,讓W(xué)indows自動(dòng)分配CPU給一個(gè)線程。
或許,你更希望能夠?qū)Ψ峙浣o線程的CPU有一些限制,使用“hard affinity”機(jī)制。
SetProcessAffinityMask函數(shù)限制一個(gè)特定的進(jìn)程只能運(yùn)行在CPU的一個(gè)子集上。
BOOL SetProcessAffinityMask(
HANDLE hProcess,
DWORD_PTR dwProcessAffinityMask);
該函數(shù)得第一個(gè)參數(shù)指明了要被限制的進(jìn)程,第二個(gè)參數(shù)是一個(gè)“位屏蔽”數(shù)據(jù),里面的每個(gè)位表示一個(gè)CPU代號(hào)(從0開始標(biāo)號(hào)),比如0x00000001表示選中CPU 0,也就是“該進(jìn)程中的線程”只能運(yùn)行在CPU 0上了;0x00000005表示同時(shí)選中CPU 0和CPU 2。
一個(gè)進(jìn)程中的子進(jìn)程可以繼承該進(jìn)程的相關(guān)性,也可以使用作業(yè)內(nèi)核對(duì)象對(duì)某些進(jìn)程限制在要求的一組CPU上執(zhí)行。
可以調(diào)用GetProcessAffinityMask函數(shù)來取得一個(gè)進(jìn)程相關(guān)性屏蔽信息。
BOOL GetProcessAffinityMask(
HANDLE hProcess,
PDWORD_PTR pdwProcessAffinityMask,
PDWORD_PTR pdwSystemAffinityMask);
該函數(shù)通過第二個(gè)參數(shù)返回指定進(jìn)程的CPU的相關(guān)性信息,同時(shí)可以通過第三個(gè)參數(shù)返回系統(tǒng)相關(guān)性信息。系統(tǒng)相關(guān)性指明系統(tǒng)的哪些CPU可以處理線程,進(jìn)程的相關(guān)性始終是系統(tǒng)相關(guān)性的子集。
以上討論的是如何把一個(gè)進(jìn)程中的所有線程限制在一組CPU上。有的時(shí)候想要把進(jìn)程的一個(gè)具體線程限制在一組CPU上。
SetThreadAffinityMask函數(shù)可以限制某一個(gè)線程只能運(yùn)行在一組CPU上。
DWORD_PTR SetThreadAffinityMask(
HANDLE hThread,
DWORD_PTR dwThreadAffinityMask);
該函數(shù)的第二個(gè)參數(shù)的意義和SetProcessAffinityMask函數(shù)中的第二個(gè)參數(shù)相同。也必須指明了一個(gè)正確的CPU子集,限制指定的線程只能運(yùn)行在這個(gè)CPU子集上。該函數(shù)返回原來的線程的相關(guān)信息。
比如,現(xiàn)在有4個(gè)線程和4個(gè)可用的CPU,你想讓線程1獨(dú)占CPU 0,讓其他3個(gè)線程只能運(yùn)行在CPU 1、CPU 2、CPU 3上,可以如下編碼:
SetThreadAffinityMask(hThread0, 0x00000001);
SetThreadAffinityMask(hThread1, 0x0000000E);
SetThreadAffinityMask(hThread2, 0x0000000E);
SetThreadAffinityMask(hThread3, 0x0000000E);
使用“hard affinity”機(jī)制來強(qiáng)行限制一個(gè)線程只能運(yùn)行在一組CPU上往往是不當(dāng)?shù)摹_@樣會(huì)降低CPU的利用率。
可用將一個(gè)理想的CPU分配一個(gè)線程。SetThreadIdealProcessor函數(shù)可用做到這一點(diǎn):
DWORD SetThreadIdealProcessor(
HANDLE hThread,
DWORD dwIdealProcessor);
該函數(shù)的第二個(gè)參數(shù)不是位屏蔽數(shù)據(jù),而是一個(gè)0~31(32位系統(tǒng))或0~63(64位系統(tǒng))的整數(shù)。該數(shù)據(jù)指明首選的CPU。也可以傳遞MAXIMUM_PROCESSORS表明當(dāng)前沒有理想的CPU。
可以在一個(gè)程序的開始階段處理相關(guān)性,代碼類似如下的代碼:
// 加載一個(gè)EXE文件映像
PLOADED_IMAGE pLoadedImage = ImageLoad(szExeName, NULL);
// 取得剛才加載的EXE文件的配置信息
IMAGE_LOAD_CONFIG_DIRECTORY ilcd;
GetImageConfigInformation(pLoadedImage, &ilcd);
// 更改進(jìn)程親掾性
ilcd.ProcessAffinityMask = 0x00000003; // I desire CPUs 0 and 1
// 保存新的加載信息(包含剛才設(shè)置的親掾性)
SetImageConfigInformation(pLoadedImage, &ilcd);
ImageUnload(pLoadedImage); // 從內(nèi)存卸載映像