永遠也不完美的程序

不斷學(xué)習(xí)，不斷實踐，不斷的重構(gòu)……

導(dǎo)航

<

2025年9月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

公告

email:air_liang1212@163.com qq:47001676

留言簿(10)

隨筆分類

文章分類

隨筆檔案

文章檔案

相冊

生活照

閱讀排行榜

評論排行榜

常用鏈接

統(tǒng)計

隨筆 - 39
文章 - 61
評論 - 173
引用 - 0

積分與排名

積分 - 278336
排名 - 94

好友鏈接

gkEngine
零一

Dx 10 與 Dx 9 的一些技術(shù)區(qū)別(轉(zhuǎn))

本文件來自：http://blog.csdn.net/codeboycjy/archive/2009/11/29/4900467.aspx

引言：
DX10發(fā)布已經(jīng)有一段時間了，網(wǎng)上可以查到很多關(guān)于Dx9與10的區(qū)別的文章。但是大多數(shù)都是從玩家角度考慮的。只是展示一下Dx9和Dx10分別渲染出的圖片，并且Dx9所渲染的圖片經(jīng)常會縮水很多，目的就是為了展示出Dx10的強大。給大多數(shù)人的理解就是，DX10能做出比Dx9好很多的畫面。我并不否認Dx10比Dx9優(yōu)化了很多，但是隨便展示出兩張圖片進行對比，其實意義也不是特別的大。因為我們不知道幀率的對比。而且雖然很多新的技術(shù)在Dx9 里面沒有，但是還是有一部分可以用其他方法模擬出來的，只是效率上有所下降。

本文簡單介紹了DX10和DX9的一些技術(shù)上的區(qū)別。從程序員的角度看DX10比DX9優(yōu)勢的地方。適合對于Dx有一定了解的朋友。

正文：
在Windows 98的年代里，GDI和DirectX是完全獨立的兩個接口。GDI（Graphical Device Interface）是專門用于二維圖形顯示的接口，封裝了一些基本的功能，效率相對DirectX來說要低一些。而DirectX是專門用于游戲開發(fā)領(lǐng) 域的，它允許用戶通過這個接口直接與硬件交互。但是這兩個接口之間的交互是非常受限制的，主要原因就是由于底層的驅(qū)動架構(gòu)：

我們看到，在這個驅(qū)動模型里面，底層的硬件驅(qū)動都是獨立的兩部分。直到Windows Vista的發(fā)布，微軟更新了底層的驅(qū)動模型

在這個新的驅(qū)動架構(gòu)下，所有的圖形接口都是基于DirectX Runtime的。這就為GDI和DirectX交互提供了可能，這也是Vista能夠提供更好的用戶界面體驗的一個重要原因。DirectX9為了向下兼容，所以不得不做一些妥協(xié)的工作。例如當(dāng)VRAM的占用超出了一定界限的時候，Dx9會發(fā)出error，而這并不是因為驅(qū)動無法提供更多的VRAM。事實上，底層驅(qū)動完全可以提供幾乎無限的VRAM，但是為了向下兼容其他比較舊的顯卡，因為這些卡在這里面可能會出現(xiàn)問題，所以Dx9還會出現(xiàn)Error。由于這種向下兼容的被迫妥協(xié)，不免使得Dx9在Vista下的表現(xiàn)不能完全利用底層的優(yōu)勢。對于Dx熟悉的朋友可能會注意到，在Dx9與Dx10之間，有一版Dx 9Ex。這一個版本的Dx是不能在XP下運行的，因為它更多的利用了新的驅(qū)動模型的優(yōu)勢，需要新的驅(qū)動模型才可以支持。而XP下的驅(qū)動模型還是上面的模型。Dx10是完全建立在新的驅(qū)動模型下面的全新的接口，它在Vista下可以完全發(fā)揮底層設(shè)計的優(yōu)勢。但是也同樣需要WDDM的支持，這就是DX10不能在XP下運行的最主要的原因了。

簡單從底層介紹了一下Dx9與Dx10的區(qū)別（希望了解更深入的朋友，可以查看DX SDK里面的Graphics APIs in Windows那篇文章）。那么下面我來介紹一下從編程接口角度看，DX10為我們帶來了一些什么樣的變化：

完全的可編程管線：
在DX10里面，是沒有固定管線的。如果程序員想用這個接口渲染圖形的話，就必須自己寫Shader腳本來實現(xiàn)圖元的現(xiàn)實。事實上，在大多數(shù)次時代的三維游戲中，幾乎很少有單純的固定管線渲染的圖元了。因為Phong模型的表現(xiàn)力畢竟還很有限，只通過diffuse, specular等一些簡單的屬性描述出的東西很難讓人信服。可能唯一大量需要固定管線的部分就是二維圖形UI部分了。如果UI不是特別復(fù)雜，只是渲染二維圖片的話，固定管線的功能也就很方便了。不過實現(xiàn)一個模擬固定管線的Shader腳本也并不是什么麻煩事情，所以即使Dx10沒有固定管線，也對程序員來說，也不是什么損失了。

完全的HLSL腳本編寫：
對于早期的可編程管線有了解的朋友，可能會想起來，在Dx8的時候是可以用類匯編語言來編寫Shader腳本的。在Dx9可以用兩者任意一個來編寫Shader了。但是在DX10里面，是不可以用匯編來寫shader腳本的。

Shader Model 4.0：
在Dx10里的Shader是基于Shader Model 4.0的。具體細節(jié)我不是很清楚，但是SM 4.0有更多的指令數(shù)。如果實現(xiàn)個多光源的效果，可能在SM2.0里面只能做到8個（當(dāng)然不排除能做更多個），是因為指令數(shù)目是有限制的。那么在新的 SM4.0里面，肯定是可以實現(xiàn)更多的光源數(shù)目了。當(dāng)然這只是一個例子而已，而且多光源技術(shù)也不是什么先進的東西，很多場景中都被延遲光照所取代了。

沒有CAPS：
在Dx9里面，程序員經(jīng)常會查詢那些功能是被硬件所支持的，哪些是不能的。而在Dx10里面，CAPS的概念就被移除了。一塊顯卡或者支持DX10的所有特性，或者干脆就不是塊DX10顯卡。那么意味著程序員可以使用DX10的一切功能而不需要在這之前查詢當(dāng)前硬件是否支持這項功能。

Geometry Shader:
GS是DX10新推出的一個概念。它是在VS和PS之間的一個GPU Kernel類型，負責(zé)接收由VS處理后的頂點，然后可以生成新的頂點，重新做處理。舉一個簡單的例子，粒子系統(tǒng)，假設(shè)有1k個粒子。那么每幀實際需要從 CPU傳輸?shù)紾PU的數(shù)據(jù)是1K*4，因為每個粒子由四個頂點組成。而這些數(shù)據(jù)是要走PCIE總線的，這個總線的帶寬的效率遠遠不及GPU On Chip Memory的。如果有了GS，我們完全可以只傳輸每個粒子的中心，然后GS由粒子中心信息生成新的頂點。那么這樣以來，就可以省下四倍的傳輸。當(dāng)然這只是一個簡單的例子而已，而且即使在DX9上渲染粒子系統(tǒng)，粒子的更新如果用GPU來處理的話，完全可以不傳輸每個粒子的信息。

Shader腳本開始支持整型數(shù)據(jù)：
在DX9里面，實際上Shader中是沒有整數(shù)的概念的。即使在VS或者PS里面聲明一個int，其實硬件通過float的轉(zhuǎn)換來處理的。在DX10里面，是有對于整數(shù)的支持的。可以對整數(shù)進行位運算等操作，這些都是在硬件上實現(xiàn)的。輸入的紋理的數(shù)據(jù)類型也可以是整型的。

貼兩張網(wǎng)上對比Dx9和Dx10的效果圖吧，^_^。

左邊的兩張是Dx9的右邊是Dx10的。

DX10有了這些變化后，可以方便程序員進行開發(fā)。但不是說DX10可以做到的東西，DX9就完全做不到，只不過是DX10的效率更高一些。我們看上面的對比圖，其實如果做一個fake的光照效果，左下角的圖完全可以用DX9模擬出來（個人感覺只是右邊加上了點后處理特效而已）。舉另一個例子來說，用 DX10做陰影效果，Shadow Volumn可以在GPU端利用GS來生成，然后用Stream-out功能把生成的資源再利用，從而做出這個效果。但是我們也同樣在DX9上看到了 Shadow Volumn的Demo。其實效果是差不多的，主要區(qū)別在于前者利用了GPU去生成Shadow Volumn，這個任務(wù)本身就是一個并行的過程，GPU處理要優(yōu)于CPU處理。而且渲染是在GPU端進行的，如果利用CPU生成的數(shù)據(jù)，就必須把數(shù)據(jù)通過 PCIE傳輸?shù)斤@卡上，這些也是很耗時的過程。當(dāng)然，如果實在要用DX9在GPU端生成Shadow Volumn，還可以通過CUDA，OpenCL等一些通用計算接口來幫助處理。但是這樣會給程序很大限制，因為AMD和Nvidia有各自不同的解決方案，如果你用了其中一家的，就很難在另一家的卡上Work（OpenCL除外）。

基本上就介紹這些內(nèi)容吧，我了解的還很少，很多東西是查資料的。如果有什么錯誤的地方，歡迎和我交流。^_^

posted on 2011-02-11 14:47 狂爛球閱讀(2947) 評論(0) 編輯收藏引用所屬分類: 圖形編程

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: （轉(zhuǎn)）多線程渲染(Multithreaded- rendering)3D引擎實例分析 : FlagshipEngine Dx 10 與 Dx 9 的一些技術(shù)區(qū)別(轉(zhuǎn)) shader復(fù)雜與深入：Normal Map（法線貼圖）2 shader復(fù)雜與深入：Normal Map（法線貼圖）1 Cascaded shadow map（轉(zhuǎn)） Light Pre Pass in XNA: Basic Implementation 一起學(xué)習(xí)Shadow mapping 修改ETM,用Ogre實現(xiàn)《天龍八部》地形與部分場景詳解（轉(zhuǎn)）骨骼動畫導(dǎo)論（轉(zhuǎn)） Ogre骨骼動畫融合（轉(zhuǎn)）

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品