看到這篇文章寫的還不錯,順手轉過來了^_^
一、最近在優化客戶端性能的時候,看到了Early ZBuffer。在VSPS中間GPU會對進行Z-buffer預判機制,對無效像素進行剔除,ATI、NVIDIA都有自己的Z-buffer預判機制。其實Doom3的時候已經開始使用預填充ZBuffer了,因為Doom3的PS需要處理陰影、NormalMap、LightMap及其他貼圖處理,PS指令非常多,所以無效像素的剔除對性能影響是很大的,越早將無效像素剔除,顯卡便能獲得更多的時間對有效像素進行渲染。
二、Early-Z技術介紹(這段摘自http://tech.sina.com.cn/h/2008-06-17/09302262913.shtml)
當代的GPU都會采用Z-buffer去記錄哪些像素是可見,而哪些像素是被遮擋而不可見。一個3D Frame最終要轉換成為2D圖像才能表示在屏幕上面,來自GPU連續的頂點流(vertices)會構建這個frame,從這個頂點流獲取相應的2D坐 標去生成多邊形。多邊形的連續產生會覆蓋原來的區域,因而Z-buffer的信息就是告訴ROP,哪些像素是可見哪些是不可見的。提前進行的Early- Z對比可以節省大量資源,因為同一個區域被多個多邊形覆蓋的次數輕而易舉地達到原來的四倍甚至更高


目前甚少方法可以利用Z-buffer信息去挑選或者排出被遮擋像素的渲染,Z-Cull就是這樣的一個方法。Z-comparision通常 會發生在ROP的后期。問題就產生,意味著pixel要通過完整的ROP管線才能被發現是否可見。一些復雜的包含數千步驟的shader程序,即使是被遮 擋的pixel也全部通過流水線,這顯然浪費了GPU的性能。Early-Z移去不可見像素在它們進入流水線之前,這樣顯然會提高性能,NVIDIA認為 這個操作提升22%附近的性能。
三、具體實現:場景渲染兩遍:
void Render()
{
DrawZPass();
DrawColorPass();
}
// 關閉ColorBuffer寫入,以最簡單的渲染狀態繪制場景
void DrawZPass()
{
// Disable color writes
pD3DDevice->SetRenderState( D3DRS_COLORWRITEENABLE, 0x00000000);
// Ensure alpha off
pD3DDevice->SetRenderState( D3DRS_ALPHABLENDENABLE, false );
pD3DDevice->SetRenderState( D3DRS_ALPHATESTENABLE, false );
// Ensure z-enabled
pD3DDevice->SetRenderState( D3DRS_ZENABLE, true );
pD3DDevice->SetRenderState( D3DRS_ZWRITEENABLE, true );
DrawScene();
pD3DDevice->SetRenderState( D3DRS_COLORWRITEENABLE, 0x0000000F );
}
// 正常渲染
void DrawColorPass()
{
pD3DDevice->SetRenderState( D3DRS_DEPTHBIAS, F2DW(-0.001f) );
DrawScene()
}
1.DrawZPass:應該跳過AlphaBlend、AlphaTest的實體。
2.DrawColorPass:對于那些預寫入ZBuffer的實體,在這個Pass中只需開啟ZBufferTest、并且可以關閉ZBufferWrite。
3.使用了EarlyZBuffer,就不用再排序了。
4.在第二遍渲染的時候,因為浮點的誤差,會有ZFighting現象,所以應允許一定的誤差。
5.Early ZBuffer不一定適用所有場景,比如有大量實體的室外場景,因為DrawZPass畢竟也要繪制所有的實體,如果調用太多DP,性能反而會有所下降。
四、
另外一個性能優化提示:先畫UI;最后繪制天空盒。這也于ZBuffer有關,因為天空盒總是顯示在最后,而天空盒總是被前面的實體遮擋了大部分區域。
不過最后繪制天空盒時候,大家會問如何避免被FarPlane裁剪,有一個技巧可以解決,在SkyShader的VS輸出投影后的位置時,這樣設置:
Out.position = mul(mvp, vertex).xyww。// 不是Out.position = mul(mvp, vertex);
這樣天空盒投影后的總是映射到FarPlane,這樣就完美了,哈哈。這個方法時我在ATI的《Depth In Depth》文檔中看到的。UI也是,游戲里的UI區域如果預先寫入ZBuffer,也可以避免大量的無效PS處理。
五、最后希望大家可以仔細看看
《Depth In Depth》,里邊有很多優化提示。