麒麟子

導(dǎo)航

<

2025年9月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

統(tǒng)計(jì)

隨筆 - 188
文章 - 0
評(píng)論 - 308
引用 - 0

常用鏈接

留言簿(12)

隨筆分類

隨筆檔案

Friends

honeycat
maval

WebSites

DevMaster
GameDev

積分與排名

積分 - 315998
排名 - 81

閱讀排行榜

評(píng)論排行榜

渲染狀態(tài)管理

轉(zhuǎn)自：http://www.abc188.com/info/html/wangzhanyunying/jianzhanjingyan/20080417/71683.html

文檔簡介：提高3D圖像程式的性能是個(gè)很大的課題。圖像程式的優(yōu)化大致能夠分成兩大任務(wù)，一是要有好的場景管理程式，能快速剔除不可見多邊形，并根據(jù)對(duì)象距相機(jī)遠(yuǎn)近選擇合適的細(xì)節(jié)（LOD）；二是要有好的渲染程式，能快速渲染送入渲染管線的可見多邊形。我們知道，使用

　　文檔簡介：
　　提高3D圖像程式的性能是個(gè)很大的課題。圖像程式的優(yōu)化大致能夠分成兩大任務(wù)，一是要有好的場景管理程式，能快速剔除不可見多邊形，并根據(jù)對(duì)象距相機(jī)遠(yuǎn)近選擇合適的細(xì)節(jié)（LOD）；二是要有好的渲染程式，能快速渲染送入渲染管線的可見多邊形。
　　我們知道，使用OpenGL或Direct3D渲染圖像時(shí)，首先要配置渲染狀態(tài)，渲染狀態(tài)用于控制渲染器的渲染行為。應(yīng)用程式能夠通過改變渲染狀態(tài)來控制OpenGL或Direct3D的渲染行為。比如配置Vertex/Fragment Program、綁定紋理、打開深度測試、配置霧效等。
　　改變渲染狀態(tài)對(duì)于顯卡而言是比較耗時(shí)的操作，而假如能合理管理渲染狀態(tài)，避免多余的狀態(tài)轉(zhuǎn)換，將明顯提升圖像程式性能。這篇文章將討論渲染狀態(tài)的管理。

文檔目錄：
　　基本思想
　　實(shí)際問題
　　渲染腳本

文檔內(nèi)容：

基本思想
　　我們考慮一個(gè)典型的游戲場景，包含人、動(dòng)物、植物、建筑、交通工具、武器等。稍微分析一下就會(huì)發(fā)現(xiàn)，實(shí)際上場景里很多對(duì)象的渲染狀態(tài)是相同的，比如任何的人和動(dòng)物的渲染狀態(tài)一般都相同，任何的植物渲染狀態(tài)也相同，同樣建筑、交通工具、武器也是如此。我們能夠把具備相同的渲染狀態(tài)的對(duì)象歸為一組，然后分組渲染，對(duì)每組對(duì)象只需要在渲染前配置一次渲染狀態(tài)，并且還能夠保存當(dāng)前的渲染狀態(tài)，配置渲染狀態(tài)時(shí)只需改變和當(dāng)前狀態(tài)不相同的狀態(tài)。這樣能夠大大減少多余的狀態(tài)轉(zhuǎn)換。下面的代碼段演示了這種方法：

// 渲染狀態(tài)組鏈表，由場景管理程式填充
RenderStateGroupList groupList;
// 當(dāng)前渲染狀態(tài)
RenderState curState;

……

// 遍歷鏈表中的每個(gè)組
RenderStateGroup *group = groupList.GetFirst();
while ( group != NULL )
{
// 配置該組的渲染狀態(tài)
RenderState *state = group->GetRenderState();
state->ApplyRenderState( curState );

// 該渲染狀態(tài)組的對(duì)象鏈表
RenderableObjectList *objList = group->GetRenderableObjectList();
// 遍歷對(duì)象鏈表的每個(gè)對(duì)象
RenderableObject *obj = objList->GetFirst();
while ( obj != NULL )
{
// 渲染對(duì)象
obj->Render();

obj = objList->GetNext();
}

group = groupList.GetNext();
}

其中RenderState類的ApplyRenderState方法形如：
void RenderState::ApplyRenderState( RenderState &curState )
{
// 深度測試
if ( depthTest != curState.depthTest )
{
SetDepthTest( depthTest );
curState.depthTest = depthTest;
}

// Alpha測試
if ( alphaTest != curState.alphaTest )
{
SetAlphaTest( alphaTest );
curState.alphaTest = alphaTest;
}

// 其他渲染狀態(tài)
……
}

　　這些分組的渲染狀態(tài)一般被稱為Material或Shader。這里Material不同于OpenGL和Direct3D里面用于光照的材質(zhì)，Shader也不同于OpenGL里面的Vertex/Fragment Program和Direct3D里面的Vertex/Pixel Shader。而是指封裝了的顯卡渲染圖像需要的狀態(tài)（也包括了OpenGL和Direct3D原來的Material和Shader）。

　　從字面上看，Material（材質(zhì)）更側(cè)重于對(duì)象表面外觀屬性的描述，而Shader（這個(gè)詞實(shí)在不好用中文表示）則有用程式控制對(duì)象表面外觀的含義。由于顯卡可編程管線的引入，渲染狀態(tài)中包含了Vertex/Fragment Program，這些小程式能夠控制物體的渲染，所以我覺得將封裝的渲染狀態(tài)稱為Shader更合適。這篇文章也將稱之為Shader。

　　上面的代碼段只是簡單的演示了渲染狀態(tài)管理的基本思路，實(shí)際上渲染狀態(tài)的管理需要考慮很多問題。
渲染狀態(tài)管理的問題
　

　消耗時(shí)間問題
　　改變渲染狀態(tài)時(shí)，不同的狀態(tài)消耗的時(shí)間并不相同，甚至在不同條件下改變渲染狀態(tài)消耗的時(shí)間也不相同。比如綁定紋理是個(gè)很耗時(shí)的操作，而當(dāng)紋理已在顯卡的紋理緩存中時(shí)，速度就會(huì)很快。而且隨著硬件和軟件的發(fā)展，一些很耗時(shí)的渲染狀態(tài)的消耗時(shí)間可能會(huì)有減少。因此并沒有一個(gè)準(zhǔn)確的消耗時(shí)間的數(shù)據(jù)。

　　雖然消耗時(shí)間無法量化，情況不同消耗的時(shí)間也不相同，但一般來說下面這些狀態(tài)轉(zhuǎn)換是比較消耗時(shí)間的：

Vertex/Fragment Program模式和固定管線模式的轉(zhuǎn)換（FF，F(xiàn)ixed Function Pipeline）

Vertex/Fragment Program本身程式的轉(zhuǎn)換

改變Vertex/Fragment Program常量

紋理轉(zhuǎn)換

頂點(diǎn)和索引緩存（Vertex & Index Buffers）轉(zhuǎn)換

　　有時(shí)需要根據(jù)消耗時(shí)間的多少來做折衷，下面將會(huì)碰到這種情況。

　渲染狀態(tài)分類
　　實(shí)際場景中，往往會(huì)出現(xiàn)這樣的情況，一類對(duì)象其他渲染狀態(tài)都相同，只是紋理和頂點(diǎn)、索引數(shù)據(jù)不同。比如場景中的人，只是身材、長相、服裝等不同，也就是說只有紋理、頂點(diǎn)、索引數(shù)據(jù)不同，而其他如Vertex/Fragment Program、深度測試等渲染狀態(tài)都相同。相反，一般不會(huì)存在紋理和頂點(diǎn)、索引數(shù)據(jù)相同，而其他渲染狀態(tài)不同的情況。我們能夠把紋理、頂點(diǎn)、索引數(shù)據(jù)不歸入到Shader中，這樣場景中任何的人都能夠用一個(gè)Shader來渲染，然后在這個(gè)Shader下對(duì)紋理進(jìn)行分組排序，相同紋理的人放在一起渲染。
　多道渲染（Multipass Rendering）
　　有些比較復(fù)雜的圖像效果，在低檔顯卡上需要渲染多次，每次渲染一種效果，然后用GL_BLEND合成為最終效果。這種方法叫多道渲染Multipass Rendering，渲染一次就是個(gè)pass。比如做逐像素凹凸光照，需要計(jì)算環(huán)境光、漫射光凹凸效果、高光凹凸效果，在NV20顯卡上只需要1個(gè)pass，而在NV10顯卡上則需要3個(gè)pass。Shader應(yīng)該支持多道渲染，即一個(gè)Shader應(yīng)該分別包含每個(gè)pass的渲染狀態(tài)。

不同的pass往往渲染狀態(tài)和紋理都不同，而頂點(diǎn)、索引數(shù)據(jù)是相同的。這帶來一個(gè)問題：是以對(duì)象為單位渲染，一次渲染一個(gè)對(duì)象的任何pass，然后渲染下一個(gè)對(duì)象；還是以pass為單位渲染，第一次渲染任何對(duì)象的第一個(gè)pass，第二次渲染任何對(duì)象的第二個(gè)pass。下面的程式段演示了這兩種方式：

以對(duì)象為單位渲染

// 渲染狀態(tài)組鏈表，由場景管理程式填充
ShaderGroupList groupList;

……

// 遍歷鏈表中的每個(gè)組
ShaderGroup *group = groupList.GetFirst();
while ( group != NULL )
{
Shader *shader = group->GetShader();

RenderableObjectList *objList = group->GetRenderableObjectList();

// 遍歷相同Shader的每個(gè)對(duì)象
RenderableObject *obj = objList->GetFirst();
while ( obj != NULL )
{
// 獲取shader的pass數(shù)
int iNumPasses = shader->GetPassNum();
for ( int i = 0; i < iNumPasses; i )
{
// 配置shader第i個(gè)pass的渲染狀態(tài)
shader->ApplyPass( i );
// 渲染對(duì)象
obj->Render();
}

obj = objList->GetNext();
}

group = groupList->GetNext();
}

以pass為單位渲染

// 渲染狀態(tài)組鏈表，由場景管理程式填充
ShaderGroupList groupList;

……

for ( int i = 0; i < MAX_PASSES_NUM; i )
{
// 遍歷鏈表中的每個(gè)組
ShaderGroup *group = groupList.GetFirst();
while ( group != NULL )
{
Shader *shader = group->GetShader();
int iNumPasses = shader->GetPassNum();
// 假如shader的pass數(shù)小于循環(huán)次數(shù)，跳過此shader
if( i >= iNumPasses )
{
group = groupList->GetNext();
continue;
}

// 配置shader第i個(gè)pass的渲染狀態(tài)
shader->ApplyPass( i );

RenderableObjectList *objList =
group->GetRenderableObjectList();

// 遍歷相同Shader的每個(gè)對(duì)象
RenderableObject *obj = objList->GetFirst();
while ( obj != NULL )
{
obj->Render();

obj = objList->GetNext();
}

group = groupList->GetNext();
}
}

　　這兩種方式各有什么優(yōu)缺點(diǎn)呢？

　　以對(duì)象為單位渲染，渲染一個(gè)對(duì)象的第一個(gè)pass后，馬上緊接著渲染這個(gè)對(duì)象的第二個(gè)pass，而每個(gè)pass的頂點(diǎn)和索引數(shù)據(jù)是相同的，因此第一個(gè)pass將頂點(diǎn)和索引數(shù)據(jù)送入顯卡后，顯卡Cache中已有了這個(gè)對(duì)象頂點(diǎn)和索引數(shù)據(jù)，后續(xù)pass不必重新將頂點(diǎn)和索引數(shù)據(jù)拷到顯卡，因此速度會(huì)很快。而問題是每個(gè)pass的渲染狀態(tài)都不同，這使得實(shí)際上每次渲染都要配置新的渲染狀態(tài)，會(huì)產(chǎn)生大量的多余渲染狀態(tài)轉(zhuǎn)換。

　　以pass為單位渲染則正好相反，以Shader分組，相同Shader的對(duì)象一起渲染，能夠只在這組開始時(shí)配置一次渲染狀態(tài)，相比以對(duì)象為單位，大大減少了渲染狀態(tài)轉(zhuǎn)換?？墒敲看武秩镜膶?duì)象不同，因此每次都要將對(duì)象的頂點(diǎn)和索引數(shù)據(jù)拷貝到顯卡，會(huì)消耗不少時(shí)間。
　　可見想減少渲染狀態(tài)轉(zhuǎn)換就要頻繁拷貝頂點(diǎn)索引數(shù)據(jù)，而想減少拷貝頂點(diǎn)索引數(shù)據(jù)又不得不增加渲染狀態(tài)轉(zhuǎn)換。魚和熊掌不可兼得 :-(
　　由于硬件條件和場景數(shù)據(jù)的情況比較復(fù)雜，具體哪種方法效率較高并沒有定式，兩種方法都有人使用，具體選用那種方法需要在實(shí)際環(huán)境測試后才能知道。

　多光源問題
待續(xù)……

　陰影問題
待續(xù)……

　

渲染腳本
　　現(xiàn)在很多圖像程式都會(huì)自己定義一種腳本文檔來描述Shader。

　　比如較早的OGRE（Object-oriented Graphics Rendering Engine，面向?qū)ο髨D像渲染引擎）的Material腳本，Quake3的Shader腳本，連同剛問世不久的Direct3D的Effect File，nVIDIA的CgFX腳本（文檔格式和Direct3D Effect File兼容），ATI RenderMonkey使用的xml格式的腳本。OGRE Material和Quake3 Shader這兩種腳本比較有歷史了，不支持可編程渲染管線。而后面三種比較新的腳本都支持可編程渲染管線。

腳本特性范例
OGRE Material 封裝各種渲染狀態(tài)，不支持可編程渲染管線 >>>>
Quake3 Shader 封裝渲染狀態(tài)，支持一些特效，不支持可編程渲染管線 >>>>
Direct3D Effect File 封裝渲染狀態(tài)，支持multipass，支持可編程渲染管線 >>>>
nVIDIA CgFX腳本封裝渲染狀態(tài)，支持multipass，支持可編程渲染管線 >>>>
ATI RenderMonkey腳本封裝渲染狀態(tài)，支持multipass，支持可編程渲染管線 >>>>

　　使用腳本來控制渲染有很多好處：

能夠很方便的修改一個(gè)物體的外觀而不需重新編寫或編譯程式

能夠用外圍工具以所見即所得的方式來創(chuàng)建、修改腳本文檔（類似ATI RenderMonkey的工作方式），便于美工、關(guān)卡設(shè)計(jì)人員設(shè)定對(duì)象外觀，建立外圍工具和圖像引擎的聯(lián)系

能夠在渲染時(shí)將相同外觀屬性及渲染狀態(tài)的對(duì)象（也就是Shader相同的對(duì)象）歸為一組，然后分組渲染，對(duì)每組對(duì)象只需要在渲染前配置一次渲染狀態(tài)，大大減少了多余的狀態(tài)轉(zhuǎn)換

posted on 2010-01-29 14:40 麒麟子閱讀(1717) 評(píng)論(0) 編輯收藏引用所屬分類: GPU and Graphic

只有注冊用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！

相關(guān)文章: 鏡面反射矩陣推導(dǎo) Deferred Shading 2D Skinned Mesh（3D的完全翻版帶旋轉(zhuǎn)） Reflect & Refract (以水渲染為例) CubeMap視線反射方向計(jì)算詳解使用投影紋理進(jìn)行模型貼花(Mesh Decals) 兩篇講述Skinned Mesh原理的文章 HLSL中的MUL指令深層剖析程序中的四元數(shù)表示法 Computing Tangent Space Basis Vectors for an Arbitrary Mesh

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

麒麟子