談到游戲中的性能優(yōu)化,說白了就是如何提高幀率和降低內(nèi)存。
提高幀率的基本原則就是減少DP次數(shù),還有是找出時(shí)間消耗高的程序代碼加以修改。
但引擎涉及的東西非常多,有時(shí)優(yōu)化要從多方面入手,下面一個(gè)一個(gè)來說明。
首先是水體渲染的優(yōu)化:
現(xiàn)在很多游戲的習(xí)慣做法就是把水放在地某個(gè)高度的位置,然后地形在上面,從裁剪的角度來看,只要看得到地形,水是必然會(huì)渲染的,但如果我們看到的地形都是在水的上面,那這樣渲染就太浪費(fèi)了。其實(shí)有個(gè)很簡(jiǎn)單的做法,就是把地形的block,當(dāng)然,我們可以把block再細(xì)分成一邏輯上的block,每個(gè)block要記錄是否有地形的頂點(diǎn)在水的下面,有的話,如果這些block要渲染,那水也就渲染,否則水就不渲染。
地形優(yōu)化:
四叉樹地形LOD是最基本的優(yōu)化方法了,不過這里要注意一點(diǎn),每個(gè)地塊對(duì)應(yīng)不同LOD加上不同裂縫組合的indexbuffer,如果一開始把所有這些可能存在的indexbuffer都創(chuàng)建出來,那內(nèi)存會(huì)非常大。我的做法是:當(dāng)用到某個(gè)IndexBuffer的時(shí)候才實(shí)時(shí)創(chuàng)建,這樣大大減少了內(nèi)存。因?yàn)橛泻芏喾N情況下的IndexBuffer在實(shí)際情況下是不會(huì)用到的。
粒子系統(tǒng)的優(yōu)化:
傳統(tǒng)的粒子系統(tǒng)的做法是在CPU上計(jì)算好粒子的四個(gè)頂點(diǎn)位置然后再填入紋理,現(xiàn)在有種優(yōu)化方案是:定義粒子的頂點(diǎn)格式只有中心點(diǎn)和width,height,在CPU上只計(jì)算實(shí)時(shí)的中心點(diǎn)位置與width和height的大小,然后在GPU上再根據(jù)這些數(shù)據(jù)計(jì)算回粒子的四個(gè)頂點(diǎn)。
這種優(yōu)化方案可以減少粒子在CPU上的運(yùn)算量,但雖然利用到shader。
還有是粒子系統(tǒng)要共享VB和IB哦。
骨骼動(dòng)畫優(yōu)化:
利用GPU計(jì)算頂點(diǎn)是骨骼動(dòng)畫優(yōu)化的最有效手段,現(xiàn)在很多人的做法是只把骨骼動(dòng)畫的矩陣轉(zhuǎn)到GPU,然后在GPU計(jì)算每個(gè)頂點(diǎn)的位置。這種做法受到了shader寄存器數(shù)量的限制。其實(shí)還有一種做法是把矩陣寫入一個(gè)1行的浮點(diǎn)紋理,試想一下,如果是1X1024的浮點(diǎn)紋理,那可以存1024 / 4 = 256個(gè)矩陣(1個(gè)像素是R32G32B32A32F四個(gè)浮點(diǎn)的紋理),這種方式要求顯卡支持并占一定的帶寬。
模型渲染優(yōu)化:
可以利用hardware instancing,LOD等方法。帶骨骼動(dòng)畫的模型,在DX10以上可以實(shí)現(xiàn)骨骼動(dòng)畫instancing。
場(chǎng)景優(yōu)化:
現(xiàn)在流行occullsion優(yōu)化,就是把被遮擋的物體不渲染出來,我簡(jiǎn)單地說一下這種實(shí)現(xiàn)的原理:
開一個(gè)RTT,把在視錐范圍內(nèi)的渲染物取AABB,然后把這個(gè)AABB賦一個(gè)顏色(每個(gè)物體的AABB顏色都不一樣),然后渲染的時(shí)候把這個(gè)顏色作為輸出顏色渲染出來。因?yàn)殚_了深度,如果在后面被完全遮擋的物體,那最終這張RTT紋理是不存在這個(gè)物體的顏色,根據(jù)一些方法可以知道這個(gè)紋理是否有這顏色,然后通過這個(gè)顏色索引回該物體,然后把它剔除掉。DX9的occullsion query就是這樣弄。還有Occlusion Culling,我相信原理也是類似這樣。
陸續(xù)更新中……