本文件來自:http://blog.csdn.net/codeboycjy/archive/2009/11/29/4900467.aspx
引言:
DX10發布已經有一段時間了,網上可以查到很多關于Dx9與10的區別的文章。但是大多數都是從玩家角度考慮的。只是展示一下Dx9和Dx10分別渲染
出的圖片,并且Dx9所渲染的圖片經常會縮水很多,目的就是為了展示出Dx10的強大。給大多數人的理解就是,DX10能做出比Dx9好很多的畫面。我并
不否認Dx10比Dx9優化了很多,但是隨便展示出兩張圖片進行對比,其實意義也不是特別的大。因為我們不知道幀率的對比。而且雖然很多新的技術在Dx9
里面沒有,但是還是有一部分可以用其他方法模擬出來的,只是效率上有所下降。
本文簡單介紹了DX10和DX9的一些技術上的區別。從程序員的角度看DX10比DX9優勢的地方。適合對于Dx有一定了解的朋友。
正文:
在Windows
98的年代里,GDI和DirectX是完全獨立的兩個接口。GDI(Graphical Device
Interface)是專門用于二維圖形顯示的接口,封裝了一些基本的功能,效率相對DirectX來說要低一些。而DirectX是專門用于游戲開發領
域的,它允許用戶通過這個接口直接與硬件交互。但是這兩個接口之間的交互是非常受限制的,主要原因就是由于底層的驅動架構:
我們看到,在這個驅動模型里面,底層的硬件驅動都是獨立的兩部分。直到Windows Vista的發布,微軟更新了底層的驅動模型
在這個新的驅動架構下,所有的圖形接口都是基于DirectX
Runtime的。這就為GDI和DirectX交互提供了可能,這也是Vista能夠提供更好的用戶界面體驗的一個重要原因。DirectX9為了向下
兼容,所以不得不做一些妥協的工作。例如當VRAM的占用超出了一定界限的時候,Dx9會發出error,而這并不是因為驅動無法提供更多的VRAM。事
實上,底層驅動完全可以提供幾乎無限的VRAM,但是為了向下兼容其他比較舊的顯卡,因為這些卡在這里面可能會出現問題,所以Dx9還會出現Error。
由于這種向下兼容的被迫妥協,不免使得Dx9在Vista下的表現不能完全利用底層的優勢。對于Dx熟悉的朋友可能會注意到,在Dx9與Dx10之間,有
一版Dx
9Ex。這一個版本的Dx是不能在XP下運行的,因為它更多的利用了新的驅動模型的優勢,需要新的驅動模型才可以支持。而XP下的驅動模型還是上面的模
型。Dx10是完全建立在新的驅動模型下面的全新的接口,它在Vista下可以完全發揮底層設計的優勢。但是也同樣需要WDDM的支持,這就是DX10不
能在XP下運行的最主要的原因了。
簡單從底層介紹了一下Dx9與Dx10的區別(希望了解更深入的朋友,可以查看DX SDK里面的Graphics APIs in Windows那篇文章)。那么下面我來介紹一下從編程接口角度看,DX10為我們帶來了一些什么樣的變化:
完全的可編程管線:
在DX10里面,是沒有固定管線的。如果程序員想用這個接口渲染圖形的話,就必須自己寫Shader腳本來實現圖元的現實。事實上,在大多數次時代的三維
游戲中,幾乎很少有單純的固定管線渲染的圖元了。因為Phong模型的表現力畢竟還很有限,只通過diffuse,
specular等一些簡單的屬性描述出的東西很難讓人信服。可能唯一大量需要固定管線的部分就是二維圖形UI部分了。如果UI不是特別復雜,只是渲染二
維圖片的話,固定管線的功能也就很方便了。不過實現一個模擬固定管線的Shader腳本也并不是什么麻煩事情,所以即使Dx10沒有固定管線,也對程序員
來說,也不是什么損失了。
完全的HLSL腳本編寫:
對于早期的可編程管線有了解的朋友,可能會想起來,在Dx8的時候是可以用類匯編語言來編寫Shader腳本的。在Dx9可以用兩者任意一個來編寫Shader了。但是在DX10里面,是不可以用匯編來寫shader腳本的。
Shader Model 4.0:
在Dx10里的Shader是基于Shader
Model 4.0的。具體細節我不是很清楚,但是SM
4.0有更多的指令數。如果實現個多光源的效果,可能在SM2.0里面只能做到8個(當然不排除能做更多個),是因為指令數目是有限制的。那么在新的
SM4.0里面,肯定是可以實現更多的光源數目了。當然這只是一個例子而已,而且多光源技術也不是什么先進的東西,很多場景中都被延遲光照所取代了。
沒有CAPS:
在Dx9里面,程序員經常會查詢那些功能是被硬件所支持的,哪些是不能的。而在Dx10里面,CAPS的概念就被移除了。一塊顯卡或者支持DX10的所有
特性,或者干脆就不是塊DX10顯卡。那么意味著程序員可以使用DX10的一切功能而不需要在這之前查詢當前硬件是否支持這項功能。
Geometry Shader:
GS是DX10新推出的一個概念。它是在VS和PS之間的一個GPU
Kernel類型,負責接收由VS處理后的頂點,然后可以生成新的頂點,重新做處理。舉一個簡單的例子,粒子系統,假設有1k個粒子。那么每幀實際需要從
CPU傳輸到GPU的數據是1K*4,因為每個粒子由四個頂點組成。而這些數據是要走PCIE總線的,這個總線的帶寬的效率遠遠不及GPU On
Chip
Memory的。如果有了GS,我們完全可以只傳輸每個粒子的中心,然后GS由粒子中心信息生成新的頂點。那么這樣以來,就可以省下四倍的傳輸。當然這只
是一個簡單的例子而已,而且即使在DX9上渲染粒子系統,粒子的更新如果用GPU來處理的話,完全可以不傳輸每個粒子的信息。
Shader腳本開始支持整型數據:
在DX9里面,實際上Shader中是沒有整數的概念的。即使在VS或者PS里面聲明一個int,其實硬件通過float的轉換來處理的。在DX10里
面,是有對于整數的支持的。可以對整數進行位運算等操作,這些都是在硬件上實現的。輸入的紋理的數據類型也可以是整型的。
貼兩張網上對比Dx9和Dx10的效果圖吧,^_^。

左邊的兩張是Dx9的右邊是Dx10的。
DX10有了這些變化后,可以方便程序員進行開發。但不是說DX10可以做到的東西,DX9就完全做不到,只不過是DX10的效率更高一些。我們看上面的
對比圖,其實如果做一個fake的光照效果,左下角的圖完全可以用DX9模擬出來(個人感覺只是右邊加上了點后處理特效而已)。舉另一個例子來說,用
DX10做陰影效果,Shadow
Volumn可以在GPU端利用GS來生成,然后用Stream-out功能把生成的資源再利用,從而做出這個效果。但是我們也同樣在DX9上看到了
Shadow Volumn的Demo。其實效果是差不多的,主要區別在于前者利用了GPU去生成Shadow
Volumn,這個任務本身就是一個并行的過程,GPU處理要優于CPU處理。而且渲染是在GPU端進行的,如果利用CPU生成的數據,就必須把數據通過
PCIE傳輸到顯卡上,這些也是很耗時的過程。當然,如果實在要用DX9在GPU端生成Shadow
Volumn,還可以通過CUDA,OpenCL等一些通用計算接口來幫助處理。但是這樣會給程序很大限制,因為AMD和Nvidia有各自不同的解決方
案,如果你用了其中一家的,就很難在另一家的卡上Work(OpenCL除外)。
基本上就介紹這些內容吧,我了解的還很少,很多東西是查資料的。如果有什么錯誤的地方,歡迎和我交流。^_^