CPU與GPU這兩個(gè)處理器不是同步運(yùn)行的,當(dāng)CPU要GPU畫(huà)第10個(gè)對(duì)象時(shí),GPU可能還在畫(huà)第一個(gè)對(duì)象。CPU與GPU不同步現(xiàn)象與是否使用Shader無(wú)關(guān),無(wú)論是否使用Shader,CPU與GPU都不會(huì)同步運(yùn)行。
CPU調(diào)用Direct3D和OpenGL的繪圖函數(shù)來(lái)繪圖時(shí),這些指定不會(huì)被GPU馬上運(yùn)行,而是存放在某一塊內(nèi)存中,這快內(nèi)存稱(chēng)為Command Buffer。GPU會(huì)一直從Command Buffer中取出CPU所指派的工作。當(dāng)Command Buffer為空時(shí),GPU就會(huì)閑下來(lái)。當(dāng)Command Buffer被塞滿(mǎn)時(shí),CPU就不能再下新的命令,這個(gè)時(shí)候若CPU繼續(xù)下命令,CPU就會(huì)被暫停,知道GPU處理并清除掉一些Command Buffer中的命令后,CPU才能繼續(xù)運(yùn)行。
如果CPU和GPU是同步運(yùn)行的,那就代表有很多時(shí)候需要把CPU暫停,等GPU畫(huà)完才能恢復(fù)CPU的運(yùn)行。例如,如果CPU調(diào)用DrawPrimitive畫(huà)一萬(wàn)個(gè)三角形,DrawPrimitive函數(shù)需要等GPU把這一萬(wàn)個(gè)三角形全部畫(huà)完才會(huì)return。這樣CPU在DrawPrimitive運(yùn)行結(jié)束前只是被暫停,沒(méi)做任何事,浪費(fèi)了硬件的資源,有效率的做法是CPU調(diào)用DrawPrimitive時(shí),DrawPrimitive函數(shù)只是把畫(huà)一萬(wàn)個(gè)三角形的指令放在Command Buffer中,指令放好后立即return,讓CPU做其他的事情。只要Command Buffer夠大、CPU新增指令和GPU繪圖的速度配合好,CPU和GPU就可以同時(shí)完成各自的工作。
CPU和GPU的不同步現(xiàn)象對(duì)Shader的編寫(xiě)事實(shí)上沒(méi)有太大影響,不過(guò)要了解這個(gè)問(wèn)題。C++代碼在試圖改變顯示內(nèi)存中的貼圖和頂點(diǎn)數(shù)據(jù)時(shí),有可能這些數(shù)據(jù)正被GPU使用。這個(gè)時(shí)候強(qiáng)制更新的話(huà),會(huì)得到錯(cuò)誤的繪圖結(jié)果。如果要CPU暫停等到GPU更新完后更新數(shù)據(jù),會(huì)拖慢程序的運(yùn)行速度。有時(shí)我們會(huì)使用double buffer的方法,讓CPU和GPU不同時(shí)存取一塊內(nèi)存。CPU更新buffer1的時(shí)候讓GPU讀取buffer2,下一個(gè)畫(huà)面是CPU更新buffer2,GPU讀取buffer1。雖然這樣會(huì)讓畫(huà)面顯示的數(shù)據(jù)慢一步,但是在視覺(jué)上沒(méi)有太大的影響。通常游戲的幀數(shù)是30到60,畫(huà)面反映慢一步,等于只是慢了1/30 - 1/60秒,幾乎不會(huì)感覺(jué)到。
----摘自《3D繪圖程序設(shè)計(jì)》