本文件來自:http://blog.csdn.net/codeboycjy/archive/2009/11/29/4900467.aspx
引言:
DX10發(fā)布已經(jīng)有一段時(shí)間了,網(wǎng)上可以查到很多關(guān)于Dx9與10的區(qū)別的文章。但是大多數(shù)都是從玩家角度考慮的。只是展示一下Dx9和Dx10分別渲染
出的圖片,并且Dx9所渲染的圖片經(jīng)常會(huì)縮水很多,目的就是為了展示出Dx10的強(qiáng)大。給大多數(shù)人的理解就是,DX10能做出比Dx9好很多的畫面。我并
不否認(rèn)Dx10比Dx9優(yōu)化了很多,但是隨便展示出兩張圖片進(jìn)行對(duì)比,其實(shí)意義也不是特別的大。因?yàn)槲覀儾恢缼实膶?duì)比。而且雖然很多新的技術(shù)在Dx9
里面沒有,但是還是有一部分可以用其他方法模擬出來的,只是效率上有所下降。
本文簡(jiǎn)單介紹了DX10和DX9的一些技術(shù)上的區(qū)別。從程序員的角度看DX10比DX9優(yōu)勢(shì)的地方。適合對(duì)于Dx有一定了解的朋友。
正文:
在Windows
98的年代里,GDI和DirectX是完全獨(dú)立的兩個(gè)接口。GDI(Graphical Device
Interface)是專門用于二維圖形顯示的接口,封裝了一些基本的功能,效率相對(duì)DirectX來說要低一些。而DirectX是專門用于游戲開發(fā)領(lǐng)
域的,它允許用戶通過這個(gè)接口直接與硬件交互。但是這兩個(gè)接口之間的交互是非常受限制的,主要原因就是由于底層的驅(qū)動(dòng)架構(gòu):
我們看到,在這個(gè)驅(qū)動(dòng)模型里面,底層的硬件驅(qū)動(dòng)都是獨(dú)立的兩部分。直到Windows Vista的發(fā)布,微軟更新了底層的驅(qū)動(dòng)模型
在這個(gè)新的驅(qū)動(dòng)架構(gòu)下,所有的圖形接口都是基于DirectX
Runtime的。這就為GDI和DirectX交互提供了可能,這也是Vista能夠提供更好的用戶界面體驗(yàn)的一個(gè)重要原因。DirectX9為了向下
兼容,所以不得不做一些妥協(xié)的工作。例如當(dāng)VRAM的占用超出了一定界限的時(shí)候,Dx9會(huì)發(fā)出error,而這并不是因?yàn)轵?qū)動(dòng)無法提供更多的VRAM。事
實(shí)上,底層驅(qū)動(dòng)完全可以提供幾乎無限的VRAM,但是為了向下兼容其他比較舊的顯卡,因?yàn)檫@些卡在這里面可能會(huì)出現(xiàn)問題,所以Dx9還會(huì)出現(xiàn)Error。
由于這種向下兼容的被迫妥協(xié),不免使得Dx9在Vista下的表現(xiàn)不能完全利用底層的優(yōu)勢(shì)。對(duì)于Dx熟悉的朋友可能會(huì)注意到,在Dx9與Dx10之間,有
一版Dx
9Ex。這一個(gè)版本的Dx是不能在XP下運(yùn)行的,因?yàn)樗嗟睦昧诵碌尿?qū)動(dòng)模型的優(yōu)勢(shì),需要新的驅(qū)動(dòng)模型才可以支持。而XP下的驅(qū)動(dòng)模型還是上面的模
型。Dx10是完全建立在新的驅(qū)動(dòng)模型下面的全新的接口,它在Vista下可以完全發(fā)揮底層設(shè)計(jì)的優(yōu)勢(shì)。但是也同樣需要WDDM的支持,這就是DX10不
能在XP下運(yùn)行的最主要的原因了。
簡(jiǎn)單從底層介紹了一下Dx9與Dx10的區(qū)別(希望了解更深入的朋友,可以查看DX SDK里面的Graphics APIs in Windows那篇文章)。那么下面我來介紹一下從編程接口角度看,DX10為我們帶來了一些什么樣的變化:
完全的可編程管線:
在DX10里面,是沒有固定管線的。如果程序員想用這個(gè)接口渲染圖形的話,就必須自己寫Shader腳本來實(shí)現(xiàn)圖元的現(xiàn)實(shí)。事實(shí)上,在大多數(shù)次時(shí)代的三維
游戲中,幾乎很少有單純的固定管線渲染的圖元了。因?yàn)镻hong模型的表現(xiàn)力畢竟還很有限,只通過diffuse,
specular等一些簡(jiǎn)單的屬性描述出的東西很難讓人信服??赡芪ㄒ淮罅啃枰潭ü芫€的部分就是二維圖形UI部分了。如果UI不是特別復(fù)雜,只是渲染二
維圖片的話,固定管線的功能也就很方便了。不過實(shí)現(xiàn)一個(gè)模擬固定管線的Shader腳本也并不是什么麻煩事情,所以即使Dx10沒有固定管線,也對(duì)程序員
來說,也不是什么損失了。
完全的HLSL腳本編寫:
對(duì)于早期的可編程管線有了解的朋友,可能會(huì)想起來,在Dx8的時(shí)候是可以用類匯編語言來編寫Shader腳本的。在Dx9可以用兩者任意一個(gè)來編寫Shader了。但是在DX10里面,是不可以用匯編來寫shader腳本的。
Shader Model 4.0:
在Dx10里的Shader是基于Shader
Model 4.0的。具體細(xì)節(jié)我不是很清楚,但是SM
4.0有更多的指令數(shù)。如果實(shí)現(xiàn)個(gè)多光源的效果,可能在SM2.0里面只能做到8個(gè)(當(dāng)然不排除能做更多個(gè)),是因?yàn)橹噶顢?shù)目是有限制的。那么在新的
SM4.0里面,肯定是可以實(shí)現(xiàn)更多的光源數(shù)目了。當(dāng)然這只是一個(gè)例子而已,而且多光源技術(shù)也不是什么先進(jìn)的東西,很多場(chǎng)景中都被延遲光照所取代了。
沒有CAPS:
在Dx9里面,程序員經(jīng)常會(huì)查詢那些功能是被硬件所支持的,哪些是不能的。而在Dx10里面,CAPS的概念就被移除了。一塊顯卡或者支持DX10的所有
特性,或者干脆就不是塊DX10顯卡。那么意味著程序員可以使用DX10的一切功能而不需要在這之前查詢當(dāng)前硬件是否支持這項(xiàng)功能。
Geometry Shader:
GS是DX10新推出的一個(gè)概念。它是在VS和PS之間的一個(gè)GPU
Kernel類型,負(fù)責(zé)接收由VS處理后的頂點(diǎn),然后可以生成新的頂點(diǎn),重新做處理。舉一個(gè)簡(jiǎn)單的例子,粒子系統(tǒng),假設(shè)有1k個(gè)粒子。那么每幀實(shí)際需要從
CPU傳輸?shù)紾PU的數(shù)據(jù)是1K*4,因?yàn)槊總€(gè)粒子由四個(gè)頂點(diǎn)組成。而這些數(shù)據(jù)是要走PCIE總線的,這個(gè)總線的帶寬的效率遠(yuǎn)遠(yuǎn)不及GPU On
Chip
Memory的。如果有了GS,我們完全可以只傳輸每個(gè)粒子的中心,然后GS由粒子中心信息生成新的頂點(diǎn)。那么這樣以來,就可以省下四倍的傳輸。當(dāng)然這只
是一個(gè)簡(jiǎn)單的例子而已,而且即使在DX9上渲染粒子系統(tǒng),粒子的更新如果用GPU來處理的話,完全可以不傳輸每個(gè)粒子的信息。
Shader腳本開始支持整型數(shù)據(jù):
在DX9里面,實(shí)際上Shader中是沒有整數(shù)的概念的。即使在VS或者PS里面聲明一個(gè)int,其實(shí)硬件通過float的轉(zhuǎn)換來處理的。在DX10里
面,是有對(duì)于整數(shù)的支持的??梢詫?duì)整數(shù)進(jìn)行位運(yùn)算等操作,這些都是在硬件上實(shí)現(xiàn)的。輸入的紋理的數(shù)據(jù)類型也可以是整型的。
貼兩張網(wǎng)上對(duì)比Dx9和Dx10的效果圖吧,^_^。

左邊的兩張是Dx9的右邊是Dx10的。
DX10有了這些變化后,可以方便程序員進(jìn)行開發(fā)。但不是說DX10可以做到的東西,DX9就完全做不到,只不過是DX10的效率更高一些。我們看上面的
對(duì)比圖,其實(shí)如果做一個(gè)fake的光照效果,左下角的圖完全可以用DX9模擬出來(個(gè)人感覺只是右邊加上了點(diǎn)后處理特效而已)。舉另一個(gè)例子來說,用
DX10做陰影效果,Shadow
Volumn可以在GPU端利用GS來生成,然后用Stream-out功能把生成的資源再利用,從而做出這個(gè)效果。但是我們也同樣在DX9上看到了
Shadow Volumn的Demo。其實(shí)效果是差不多的,主要區(qū)別在于前者利用了GPU去生成Shadow
Volumn,這個(gè)任務(wù)本身就是一個(gè)并行的過程,GPU處理要優(yōu)于CPU處理。而且渲染是在GPU端進(jìn)行的,如果利用CPU生成的數(shù)據(jù),就必須把數(shù)據(jù)通過
PCIE傳輸?shù)斤@卡上,這些也是很耗時(shí)的過程。當(dāng)然,如果實(shí)在要用DX9在GPU端生成Shadow
Volumn,還可以通過CUDA,OpenCL等一些通用計(jì)算接口來幫助處理。但是這樣會(huì)給程序很大限制,因?yàn)锳MD和Nvidia有各自不同的解決方
案,如果你用了其中一家的,就很難在另一家的卡上Work(OpenCL除外)。
基本上就介紹這些內(nèi)容吧,我了解的還很少,很多東西是查資料的。如果有什么錯(cuò)誤的地方,歡迎和我交流。^_^