出處:http://blog.csdn.net/compiler/archive/2009/03/10/3975239.aspx
常規(guī)技巧
1 只在必須的時(shí)候Clear。
IDirect3DDevice9::Clear函數(shù)通常需要花費(fèi)較多的時(shí)間,因此要盡量少調(diào)用,而且只清空的確需要清空的緩存。
2 盡量減少狀態(tài)切換。并且將需要進(jìn)行的狀態(tài)切換組合在一起設(shè)置。
狀態(tài)包括RenderState,SamplerState,TextureStageState等
3 紋理尺寸盡可能小
4 從前至后渲染場(chǎng)景中的對(duì)象
從前至后渲染可以盡可能早地精選出不需要繪制的對(duì)象和象素
5 使用三角條帶代替三角列表和三角扇。為了能更有效利用頂點(diǎn)高速緩存(cache),在排列條帶時(shí)因考慮盡快重用頂點(diǎn)。
6 根所需要據(jù)消耗的系統(tǒng)資源來逐步減少特效。
7 經(jīng)常性地檢測(cè)程序的性能。
這樣可以更容易發(fā)現(xiàn)引起性能突變的部分
8 最小化頂點(diǎn)緩存的切換
9 盡可能使用靜態(tài)頂點(diǎn)緩存
10 對(duì)靜態(tài)對(duì)象,對(duì)每種FVF使用一個(gè)大的靜態(tài)頂點(diǎn)緩存來保存多個(gè)對(duì)象的頂點(diǎn)數(shù)據(jù),而不是每個(gè)對(duì)象使用一個(gè)頂點(diǎn)緩存。
其目的也是減少頂點(diǎn)緩存的切換
11 如果程序需要隨機(jī)訪問AGP內(nèi)存中的頂點(diǎn)緩存,頂點(diǎn)格式的大小最好是32bytes的倍數(shù)。否則,選擇合適的最小的格式。
32bytes 也就是8個(gè)float數(shù)據(jù)或2個(gè)vector4。
12 使用頂點(diǎn)索引方式渲染,這樣可以更有效利用頂點(diǎn)高速緩存。
13 如果深度緩存格式中包含有模版緩存,總是將兩者一起Clear。
14 將計(jì)算結(jié)果和輸出的shader指令合并:
// Rather than doing a multiply and add, and then output the data with
// two instructions:
mad r2, r1, v0, c0
mov oD0, r2
// Combine both in a single instruction, because this eliminates an
// additional register copy.
mad oD0, r1, v0, c0
建立一個(gè)場(chǎng)景對(duì)象的數(shù)據(jù)庫,首先使用最低精度的模型,在保證性能的前提下逐步使用更高精度的模型。密切關(guān)注渲染的總的三角面數(shù)。
將使用相同渲染狀態(tài)和貼圖的圖元集中在一起繪制,這樣能盡量減少頂點(diǎn)緩存和狀態(tài)的切換。并且將狀態(tài)切換操作集中成一組設(shè)置。
盡量減少光源數(shù)量,使用環(huán)境光來提高亮度。方向光源比點(diǎn)光源和聚光燈更高效,因?yàn)楣獾姆较蚴枪潭ǖ?。使用光照范圍參?shù)來剔除不受光照影響的物體。鏡面高光幾乎使光照計(jì)算量加倍,因此只在需要時(shí)使用,將D3DRS_SPECULARENABLE設(shè)為FALSE,將材質(zhì)的specular power 設(shè)為0,將材質(zhì)的specular color 設(shè)為0。
盡量減小紋理尺寸,這樣可以增加紋理被緩存的可能性。盡量減少紋理的切換,將使用同一紋理的對(duì)象集中繪制。盡量使用正方形紋理。最快的紋理是256×256,將4張128×128的紋理拼接成256×256使用。
連接World-View Matrix, 將ViewMatrix設(shè)為Identity減少矩陣乘法運(yùn)算。
動(dòng)態(tài)紋理。首先要檢查D3DCAPS2_DYNAMICTEXTURES來判斷硬件是否支持。
其二,動(dòng)態(tài)紋理不能放在MANAGED pool中。動(dòng)態(tài)紋理總是能鎖定,甚至是在D3DPOOL_DEFAULT中。D3DLOCK_DISCARD是合法的。
DrawProceduralTexture(pTex)
{
// pTex should not be very small because overhead of
// calling driver every D3DLOCK_DISCARD will not
// justify the performance gain. Experimentation is encouraged.
pTex->Lock(D3DLOCK_DISCARD);
<Overwrite *entire* texture>
pTex->Unlock();
pDev->SetTexture();
pDev->DrawPrimitive();
}
當(dāng)需要在每幀里鎖定頂點(diǎn)或索引緩存是,應(yīng)該使用動(dòng)態(tài)緩存(D3DUSAGE_DYNAMIC)。對(duì)動(dòng)態(tài)緩存使用D3DLOCK_DISCARD鎖定能減少延遲。D3DLOCK_NOOVERWRITE鎖定可以用于在緩存空閑處添加新的數(shù)據(jù)而不修改已經(jīng)寫入的數(shù)據(jù)。
使用Effect時(shí),應(yīng)該根據(jù)Effect,然后根據(jù)Technique來安排渲染順序,也就是使用相同Effect和Technique的物體應(yīng)該集中繪制。這樣可以減少狀態(tài)切換開銷。
本文來自CSDN博客,轉(zhuǎn)載請(qǐng)標(biāo)明出處:http://blog.csdn.net/compiler/archive/2009/03/10/3975239.aspx