flagship的理想與現實

創新+實踐

C++博客 :: 首頁 :: 聯系 :: 聚合

:: 管理

8 Posts :: 0 Stories :: 27 Comments :: 0 Trackbacks

常用鏈接

留言簿(8)

我參與的團隊

隨筆分類

隨筆檔案

搜索

閱讀排行榜

評論排行榜

3D引擎多線程：渲染與邏輯分離

        目前的3D引擎的渲染幀和邏輯幀都是在一個線程上運行的，在網絡游戲中大量玩家聚集，繁重的骨骼動畫計算和粒子計算極大的拖累了渲染幀數，有兩種有效措施：1、控制同屏顯示人數，但玩家體驗不好 2、幀數低于某值時減少動畫Tick頻率，但帶來的問題是動畫不連貫。
        如果考慮使用多線程優化，最容易想到的就是采用平行分解模式，將骨骼動畫計算和粒子計算寫成兩個for循環，然后用OpenMP將其多線程化，但事實上這樣并不會提高多少效率，這兩者計算仍然要阻滯渲染幀，線程的創建也有一定的消耗。于是我想到了一種極端的解決方案，采用任務分解模式，將渲染和邏輯完全分離到兩個線程去，互不影響，當然這樣線程同步會是大問題，畢竟線程的數量和BUG的數量是成正比的。
        我們首先來分析下這兩個線程分別需要做什么工作，需要那些數據。渲染線程需要獲取實體的位置、材質等信息，并交給GPU渲染，邏輯線程需要更新實體的位置、材質、骨骼動畫等數據，很顯然一個寫入一個讀取，這為我們實現一個沒有線程同步的多線程3D渲染系統提供了可能。
        為了讓讀取和寫入不需要Lock，我們需要為每一份數據設計一個帶有冗余緩存的結構，讀取線程讀取的是上次寫入完成的副本，而寫入線程則向新的副本寫入數據，并在完成后置上最新標記，置標記的操作為原子操作即可。以Vector為例，這個結構大致是這樣的：

struct VectorData

{

Vector4f m_pVector[DATACENTER_CACHE];

int m_iIndex;

VectorData()

{

memset( m_pVector, 0, DATACENTER_CACHE * sizeof(Vector4f) );

m_iIndex = 0;

}

void Write( Vector4f& rVector )

{

int iNewIndex = m_iIndex == DATACENTER_CACHE - 1 ? 0 : m_iIndex + 1;

m_pVector[iNewIndex] = rVector;

m_iIndex = iNewIndex;

}

Vector4f& Read()

{

return m_pVector[m_iIndex];

}

};

        當然我們可以用模板來寫這個結構，讓其適用于int，float，matrix等多種數據類型，余下的工作就簡單了，將所有有共享數據的類的成員變量都定義為以上這種數據類型，例如我們可以定義：
        SharedData<Matrix4f> m_matWorld;
        在渲染線程中調用pDevice->SetWorldMatrix( m_matWorld.Read() );
        在邏輯線程中調用m_matWorld.Write( matNewWorld );

        需要注意的是，這種方案并非絕對健壯，當渲染線程極慢且邏輯線程極快的情況下，有可能寫入了超過了DATACENTER_CACHE次，而讀取卻尚未完成，那么數據就亂套了，當然真要出現了這種情況，游戲早已經是沒法玩了，我測試的結果是渲染幀小于1幀，邏輯幀大于10000幀，尚未出現問題。
        FlagshipEngine采用了這一設想，實際Demo測試結果是，計算25個角色的骨骼動畫，從靜止到開始奔跑，單線程的情況下，幀數下降了20%～30%，而使用多線程的情況下，幀數完全沒有變化！

posted on 2009-01-04 21:15 flagship 閱讀(5653) 評論(7) 編輯收藏引用所屬分類: FlagshipEngine

Feedback

# re: 3D引擎多線程：渲染與邏輯分離 2009-01-05 09:20 LOGOS

yf同學吧。使勁的踩一下，oye，處女踩
我看過的一個同步方案，和你的不同
邏輯線程在每幀結束的時候，將新的渲染context同步到渲染線程中
渲染線程在沒有新的context的仍用老的context渲染

你使用了過于底層的數據結構作為數據的同步方案，看起來以后的拓展性不是太好。
另外，jl同學說了，m_index=index在intel的CPU上也許是原子操作，但是其他CPU就不一定了。所以read方法讀取到的是不是一個合法的索引值很難說
回復更多評論

# re: 3D引擎多線程：渲染與邏輯分離 2009-01-05 10:41 flagship

啊！被發現了。。hwh同學。。你也在這里啊
你看過的同步方案，給我個鏈接吧

安全性的問題，我查過，在32位x86 CPU上int的賦值應該是原子操作，不過考慮保險，想試著改成InterlockedIncrement試試看，不知道會不會損失效率
@LOGOS
回復更多評論

# re: 3D引擎多線程：渲染與邏輯分離 2009-01-05 11:08 LOGOS

http://www.cnblogs.com/cproom/archive/2007/11/26/972548.html
回復更多評論

# re: 3D引擎多線程：渲染與邏輯分離 2009-01-16 11:06 落魄江湖-隨風而行

第一次嘗試評論，先測試一下回復更多評論

# re: 3D引擎多線程：渲染與邏輯分離 2009-01-16 11:22 落魄江湖-隨風而行

關于多線程（或smp）渲染，是一個比較麻煩的手段，通過doom3 sdk結合quake3源代碼，我這里也總結一下DOOM3/QUAKE3的多線程（SMP）渲染技術框架，供參考。
首先定義邏輯，邏輯端不涉及任何渲染操作和資源載入，僅僅是各個ENTITY的動態變化和物理碰撞檢測等，可以形成一套腳本語言，分配一個線程，稱為腳本線程，專門從事業務邏輯處理，邏輯代碼由邏輯程序員編寫。
其次，定義渲染，渲染分為兩個線程，即渲染前端線程和渲染后端線程
渲染前端線程的主要作用是進行場景管理，可視性檢測，形成COMMAND BUFFFER命令，在渲染前端線程里面不涉及到任何的渲染API的調用，例如GL/D3D等，然后由渲染前端將可視化的渲染數據提交給渲染后端，渲染后端從COMMANDBUFFER中獲得渲染數據后，進行BATCH，設置渲染狀態等，提交給渲染API進入GPU硬件流水線
使用COMMAND BUFFER事實上已經成為并行渲染系統的標準解決方案了，D3D FOR XBOX版本的API函數里面包含COMMAND BUFFER接口，事實上QUAKE3是第一個引擎使用COMMAND BUFFER實現SMP渲染的引擎。

隨風而行 QQ群 38224573 3D引擎研發[1]

回復更多評論

# re: 3D引擎多線程：渲染與邏輯分離 2009-01-16 16:06 flagship

@落魄江湖-隨風而行
COMMAND BUFFER 我不太了解，這就去查一下
我想問的是：邏輯線程如何與渲染前端線程同步的？回復更多評論

# re: 3D引擎多線程：渲染與邏輯分離 2009-02-05 16:21 conan

這個就是和ringbuffer差不多回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。


相關文章: 幾種多線程3D引擎架構的比較多Pass渲染體系與多線程渲染的矛盾 DX11與多線程渲染 3D引擎多線程：邏輯操作 3D引擎多線程：框架 3D引擎多線程：渲染與邏輯分離 3D引擎多線程：資源異步加載開篇：關于FlagshipEngine

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品