重劍無鋒，大巧不工
常有人詢問，編程需要天賦嗎？啊，任何事情走往極致，都需要天賦。任何一個軟件產(chǎn)品的極致成功，都需要創(chuàng)意天賦、編程天賦、管理天賦、行銷天賦……。然而，只需用心模仿，再加一點(diǎn)匠心獨(dú)具，任何人都能夠把編程路走得穩(wěn)當(dāng)順?biāo)臁Ｄ茏x千賦則善賦，能觀千劍則曉劍，巧者不過習(xí)者之門也。你把名家源碼融為己用，別人也會贊嘆一聲“你有編程天賦”。子曾經(jīng)曰過：編程無他，唯手熟爾！

隨筆 - 505 文章 - 1034 trackbacks - 0

2007年11月

>

日

一

二

三

四

五

六

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

19

22

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

子曾經(jīng)曰過：編程無他，唯手熟爾！

常用鏈接

留言簿(94)

隨筆分類(649)

隨筆檔案(505)

相冊

劍

BCB

C++ Builder研究

Crytek

crymod
Crytek's Offical Modding Portal

Game Industry

AMD Developer Central
Welcome to AMD Developer Central
BeautifulPixels
A guy who works on the game engine Gamebryo at Emergent Game Technologies.
CGJOY
Develop
Breaking news and the lastest jobs for European games developers
Emergent Game Technologies in Asia
Emergent sales type guy
Gamasutra
Gamasutra
GameIndustry
GameIndustry
NVIDIA Developer Zone
Programming Vertex, Geometry, and Pixel Shaders

OGRE

Ogre3d API
Ogre官網(wǎng)
Ogre中文Wiki
Ogre中文社區(qū)

other

Google代碼搜索
搜索代碼，搜索Loki::試試
Windows7之家
季莊新聞
a guy in America whose old hometown is in ShanDong Province
維基百科
我的豆瓣
read books
陽光牛牛的個人空間
中國青年

Programmers

Qt

Qt Center
Qt的信息和資源，很全
Qt Forum
Qtopia.org.cn
中國人討論Qt的地方
Qt簡體中文
有“Qt簡體中文文檔“
Qt中文論壇
貌似人氣很高啊
Qwt
好多QT控件，開源項(xiàng)目，哈哈，爽
QwtPlot3D
用Qt和OpenGL實(shí)現(xiàn)的Qt控件庫，3D的，震撼死了
Trolltech
Qt老家
Trolltech Labs
齊亮博客
一個正在挪威奧斯陸工作的中國軟件工程師

WOW Stuff

WoW Wiki

搜索

積分與排名

積分 - 923076
排名 - 14

閱讀排行榜

評論排行榜

理解D3D--(0)批次batch

“Batch, Batch, Batch:”
What Does It Really Mean?

這個看代碼里面batch相關(guān)的。

[Direct3D] 實(shí)現(xiàn)批次渲染、硬件 T&L 的渲染器和 D3DPipeline

在是否從 D3DRender 提供頂點(diǎn)緩存區(qū)操作給流水線時做了一些權(quán)衡，最后決定暫時使用 IDirect3DDevice9::DrawPrimitiveUP 來渲染，因?yàn)樗菀讜鴮懀议_銷是一次頂點(diǎn)拷貝，流水線也不用操心對緩存的使用。

D3DPipeline 并不是完整的，其涉及到從場景管理器中傳遞的靜態(tài)場景元素列表，這些元素需要事先被整理到各個子容器以便盡可能少地調(diào)整渲染狀態(tài)和寫頂點(diǎn)緩存。這些子容器由場景管理器維護(hù)，并在適當(dāng)?shù)臅r候調(diào)用 Render::DrawPrimitive 進(jìn)行渲染。

大多數(shù)的 los-lib 結(jié)構(gòu)與 D3DX 在內(nèi)存上兼容的，在保持界面獨(dú)立的同時不影響性能。例如 los::blaze::Material 與 D3DMATERIAL 即是兼容的。燈光定義則存在差異，主要原因在于 los-lib 使用了各個獨(dú)立的燈光類型，而 D3DLIGHT9 則放置在統(tǒng)一的結(jié)構(gòu)當(dāng)中，當(dāng)然，燈光對象通常并不在多個渲染狀態(tài)間改變，所以執(zhí)行兩種燈光類型數(shù)據(jù)的轉(zhuǎn)換并不影響效率。一楨通常僅進(jìn)行一次這樣的轉(zhuǎn)換。

另一個容易犯的錯誤在于幾何體法線列表的索引，法線為每個頂點(diǎn)索引設(shè)置獨(dú)立的值，而不再通過頂點(diǎn)列表的索引形式，嘗試使用頂點(diǎn)索引來查找法線將得到非預(yù)期的結(jié)果。

D3DRender:

   virtual int DrawPrimitive(const std::vector<VertexXYZ_N>& listVertex
        , const Matrix& matWorld, const Matrix& matView, const Matrix& matProj
        , const Material& material)
    {
        ptrDevice->SetTransform(D3DTS_WORLD, (CONST D3DMATRIX*)&matWorld);
        ptrDevice->SetTransform(D3DTS_VIEW, (CONST D3DMATRIX*)&matView);
        ptrDevice->SetTransform(D3DTS_PROJECTION, (CONST D3DMATRIX*)&matProj);

        ptrDevice->SetFVF(D3DFVF_XYZ | D3DFVF_NORMAL);
        ptrDevice->SetRenderState(D3DRS_FILLMODE, D3DFILL_SOLID);
        ptrDevice->SetMaterial((CONST D3DMATERIAL9*)&material);

        uint nPrim = (uint)listVertex.size() / 3;
        uint nBatch = nPrim / _D3DCaps.MaxPrimitiveCount;
        uint nByteBatch =_D3DCaps.MaxPrimitiveCount * (uint)sizeof(VertexXYZ_N) * 3;

        for (uint idx = 0; idx < nBatch ; ++idx)
            ptrDevice->DrawPrimitiveUP(D3DPT_TRIANGLELIST
            , _D3DCaps.MaxPrimitiveCount
            , &listVertex.front()
            + idx * nByteBatch
            , (uint)sizeof(VertexXYZ_N));

        ptrDevice->DrawPrimitiveUP(D3DPT_TRIANGLELIST, nPrim % _D3DCaps.MaxPrimitiveCount
            , &listVertex.front()
            + nBatch * nByteBatch
            , (uint)sizeof(VertexXYZ_N));

        return 0;
    }

    virtual int SetLights(const Lights& lights)
    {
        ptrDevice->SetRenderState(D3DRS_AMBIENT
            , (lights.globalLight.GetColor()
            * lights.globalLight.GetIntensity()).ToColor());

        uint idxLight = 0;
        for (size_t idx = 0; idx < lights.listPointLight.size(); ++idx)
        {
            const PointLight& refLight = lights.listPointLight[idx];
            D3DLIGHT9 lght;
            ::memset(&lght, 0, sizeof(D3DLIGHT9));
            lght.Type = D3DLIGHT_POINT;
            lght.Range = refLight.GetDistance();
            lght.Attenuation1 = 1.0f;

            Vector3 vPos = refLight.GetPosition();
            lght.Position.x = vPos.x;
            lght.Position.y = vPos.y;
            lght.Position.z = vPos.z;

            lght.Diffuse = lght.Specular
                = *(D3DCOLORVALUE*)&(refLight.GetColor() * refLight.GetIntensity());

            ptrDevice->SetLight(idxLight, &lght);
            ptrDevice->LightEnable(idxLight++, true);
        }

        for (size_t idx = 0; idx < lights.listParallelLight.size(); ++idx)
        {
            const ParallelLight& refLight = lights.listParallelLight[idx];
            D3DLIGHT9 lght;
            ::memset(&lght, 0, sizeof(D3DLIGHT9));
            lght.Type = D3DLIGHT_DIRECTIONAL;

            Vector3 vDir = refLight.GetDirection();
            lght.Direction.x = vDir.x;
            lght.Direction.y = vDir.y;
            lght.Direction.z = vDir.z;

            lght.Diffuse = lght.Specular
                = *(D3DCOLORVALUE*)&(refLight.GetColor() * refLight.GetIntensity());

            ptrDevice->SetLight(idxLight, &lght);
            ptrDevice->LightEnable(idxLight++, true);
        }

        for (size_t idx = 0; idx < lights.listSpotLight.size(); ++idx)
        {
            const SpotLight& refLight = lights.listSpotLight[idx];
            D3DLIGHT9 lght;
            ::memset(&lght, 0, sizeof(D3DLIGHT9));
            lght.Type = D3DLIGHT_SPOT;
            lght.Range = refLight.GetDistance();
            lght.Attenuation1 = 1.0f;
            lght.Falloff = 1.0f;
            lght.Theta = refLight.GetHotspot().ToRadian();
            lght.Phi = refLight.GetFalloff().ToRadian();

            Vector3 vDir = refLight.GetDirection();
            lght.Direction.x = vDir.x;
            lght.Direction.y = vDir.y;
            lght.Direction.z = vDir.z;

            Vector3 vPos = refLight.GetPosition();
            lght.Position.x = vPos.x;
            lght.Position.y = vPos.y;
            lght.Position.z = vPos.z;

            lght.Diffuse = lght.Specular
                = *(D3DCOLORVALUE*)&(refLight.GetColor() * refLight.GetIntensity());

            ptrDevice->SetLight(idxLight, &lght);
            ptrDevice->LightEnable(idxLight++, true);
        }

        return 0;
    }

D3DPipeline:

virtual int ProcessingObject(const Object3D& object)
    {
        ++_DebugInfo.dynamic_object_counter;

        const Model& refModel = object.GetModel();
        const Vector3& pos = object.GetPosition();

        Matrix mat = object.GetTransform()
            * object.GetOrientation().ObjectToInertial() * object.GetAxis()
            * Matrix().BuildTranslation(pos.x, pos.y, pos.z);

        for (size_t gidx = 0; gidx < refModel.listGeometry.size(); ++gidx)
        {
            const Geometry& refGeom = refModel.listGeometry[gidx];
            const Material& refMat = refModel.listMaterial[refGeom.indexMaterial];

            //Triangle triangle;
            //triangle.bitmap = (DeviceBitmap*)&refModel.listDeviceBitmap[refGeom.indexDeviceBitmap];

            std::vector<VertexXYZ_N> listVertex;
            listVertex.reserve(refGeom.listIndex.size());

            for (size_t iidx = 0; iidx < refGeom.listIndex.size(); iidx += 3)
            {
                const Vector3& vertex0 = refGeom.listVertex[refGeom.listIndex[iidx]];
                const Vector3& vertex1 = refGeom.listVertex[refGeom.listIndex[iidx + 1]];
                const Vector3& vertex2 = refGeom.listVertex[refGeom.listIndex[iidx + 2]];

                Vector3 normal0 = refGeom.listNormal[iidx];
                Vector3 normal1 = refGeom.listNormal[iidx + 1];
                Vector3 normal2 = refGeom.listNormal[iidx + 2];

                listVertex.push_back(VertexXYZ_N());
                VertexXYZ_N& refV0 = listVertex.back();
                refV0.x = vertex0.x;
                refV0.y = vertex0.y;
                refV0.z = vertex0.z;
                refV0.normal_x = normal0.x;
                refV0.normal_y = normal0.y;
                refV0.normal_z = normal0.z;

                listVertex.push_back(VertexXYZ_N());
                VertexXYZ_N& refV1 = listVertex.back();
                refV1.x = vertex1.x;
                refV1.y = vertex1.y;
                refV1.z = vertex1.z;
                refV1.normal_x = normal1.x;
                refV1.normal_y = normal1.y;
                refV1.normal_z = normal1.z;

                listVertex.push_back(VertexXYZ_N());
                VertexXYZ_N& refV2 = listVertex.back();
                refV2.x = vertex2.x;
                refV2.y = vertex2.y;
                refV2.z = vertex2.z;
                refV2.normal_x = normal2.x;
                refV2.normal_y = normal2.y;
                refV2.normal_z = normal2.z;

                ++_DebugInfo.polygon_counter;
            }

            _PtrRender->DrawPrimitive(listVertex, mat, _ViewMatrix, _PerspectiveMatrix, refMat);
        }

        return 0;
    }
};

這篇看batching段。

Direct3D的一些小貼士收藏

GPU性能調(diào)試：

通常來說，使用CPU時間事件來調(diào)試GPU是低效并且是不準(zhǔn)確的。D3D API在多數(shù)命令下會阻塞，甚至是Draw函數(shù)。它會在一些時間片上做一些真正的工作，而這往往是不可預(yù)知的。因此，GPU的性能調(diào)試只能用PIX或者是其他專用產(chǎn)品，例如NVIDIA’s NVPerfHUD來進(jìn)行。

顯卡所用的內(nèi)存：

顯卡所用的內(nèi)存可以分為兩大類：本地的和非本地的（相對于顯卡來說）。在顯卡處理的某些數(shù)據(jù)類型的時候，需要本地內(nèi)存，例如幀緩沖。非本地內(nèi)存，有時也成為AGP卡槽內(nèi)存(AGP aperture)，可以被顯卡訪問的某些數(shù)據(jù)類型所在的系統(tǒng)內(nèi)存，例如頂點(diǎn)緩沖。本地內(nèi)存要比非本地內(nèi)存快。

本地內(nèi)存通常是在顯卡內(nèi)的，但是有些顯卡可以共享系統(tǒng)內(nèi)存，這通常是平衡速度和價(jià)格之間的選擇。在這種情況下，幀緩存可以存在于系統(tǒng)內(nèi)存中，而不是在本地內(nèi)存中。這種技術(shù)下，顯卡處理某些數(shù)據(jù)的速度比不使用共享內(nèi)存的要慢，因?yàn)閿?shù)據(jù)必須從I/O Bus（例如PCI-Express）上傳輸過來。但是這可以使顯卡成本大大降低。在NVIDIA，這種技術(shù)被稱為TurboCache，而ATI稱之為HyperMemory。

著色器和著色模型：

Shader是運(yùn)行在GPU上的，處理一些D3D流水管線上一些任務(wù)的程序。有三種類型的shader，他們分別對應(yīng)三種可編程的stage：

Vertex shader (頂點(diǎn)著色器VS) stage, geometry shader (幾何著色器GS) stage, 還有pixel shader(像素著色器PS) stage。其中幾何著色器只能在DX10平臺上使用。

著色模型（shader model）是在GPU上運(yùn)行的虛擬機(jī)。每個虛擬機(jī)定義被稱為一種shader profile。并且包含了特定的匯編語言。

著色器的職責(zé)：

著色器通常是流水管線中描述物體表面的部分。例如，一種看起來像木頭的材質(zhì)被稱為木頭著色器（wood shader）。而在D3D中，這些著色語言指令集可以做的事情遠(yuǎn)不止描述物體表面。他們可以用來計(jì)算光照，矩陣轉(zhuǎn)換，頂點(diǎn)動畫，進(jìn)行裁切，動態(tài)生成新的幾何物體，等等。在Mental ray中，shader按照職責(zé)可以劃分為surface shader, light shader, shader shader, output shader等等。

在D3D中，這三種著色器的職責(zé)劃分并不是很明確。例如，光照計(jì)算過可以在頂點(diǎn)著色器，或者是像素著色器中完成，這取決于應(yīng)用程序的需求。因此，包含各種著色器的著色器集合應(yīng)運(yùn)而生。他們鏈接起來定義了一個工作流水線。

關(guān)于Direct3D 9 資源和內(nèi)存類型：

D3D支持下列類型的資源：紋理（包括常規(guī)的和渲染目標(biāo)render target），頂點(diǎn)緩沖，索引緩沖，字體，交換鏈（swap chain），狀態(tài)組，深度模板緩沖，特效等等。

有四種內(nèi)存類型（池），資源可以在這里分配：

· 默認(rèn)Default：在顯卡內(nèi)存中，包括AGP卡槽內(nèi)存和本地顯存。在設(shè)備丟失之后，必須被釋放，重構(gòu)。

· 托管Managed：存在于系統(tǒng)內(nèi)存中，按需拷貝到顯存。

· 系統(tǒng)SystemMem：永遠(yuǎn)存在于系統(tǒng)內(nèi)存中，并且不能直接用于渲染。可以當(dāng)作源或者目標(biāo)拷貝。例如UpdateSurface和UpdateTexture。

· Scrach: 永遠(yuǎn)存在于系統(tǒng)內(nèi)存中，并且不會被設(shè)備大小或格式限制，例如紋理的2的冪限制。不能把它放到顯存中。

查找資源泄露：

在關(guān)閉一個基于D3D的應(yīng)用程序時，D3D調(diào)試運(yùn)行庫會報(bào)告內(nèi)存泄露。按照以下步驟定位泄漏點(diǎn)。

1. 在DirectX Control Panel中（通常在DXSDK安裝目錄中可以找到），啟用“Use Debug Version of Direct3D 9”并且將Debug Output Level設(shè)置為”More”。確保Break on Memory Leaks被禁用。點(diǎn)擊Apply。

2. 在VS中調(diào)試運(yùn)行應(yīng)用程序。在關(guān)閉應(yīng)用程序之后，查看VS的輸出窗口Direct 3D9: (WARN) : Memory Address: 00xxxxxx, IAllocID= xx dwSize = xxxxxxxx;(pid = xxxxx)

3. 每條記錄對應(yīng)了一個資源泄漏，查看并記住ID，然后在DirectX Control Panel中輸入ID并且點(diǎn)擊Apply。

4. 再次運(yùn)行程序，重復(fù)以上步驟。程序會在分配點(diǎn)中斷，你可以檢查哪里遺忘釋放。

5. 當(dāng)你調(diào)試完成之后，別忘了將Break On AllocID設(shè)置為0。

處理設(shè)備丟失（Device Lost）

一個D3D設(shè)備可以在很多情況下丟失，例如從全屏向窗口轉(zhuǎn)換，一個電源管理事件，按CTRL+DEL+ALT返回Windows Security Dialog。

必須采取措施去檢查一個設(shè)備是否丟失，丟失了之后如何恢復(fù)。

方法：在某些地方調(diào)用IDirect3DDevice9::TestCooperativeLevel，例如在每幀開始渲染之前調(diào)用。當(dāng)發(fā)現(xiàn)設(shè)備丟失之后，采取下列措施：

1. 釋放所有在Default內(nèi)存中的資源

2. 釋放其他沒有和Default, Managed, SystemMem綁定的資源

3. 調(diào)用IDirect3DDevice9::TestCooperativeLevel去確認(rèn)設(shè)備是否可以被重置如果能，那么調(diào)用IDirect3DDevice9::Reset 如果不能，繼續(xù)等待，然后再嘗試

4. 重新創(chuàng)建需要的資源

渲染目標(biāo)和交換鏈（Render Targets and Swap Chains）

一個渲染目標(biāo)是一個用于保存在圖形流水線輸出像素的表面。也就是說，它是一個顏色數(shù)組。一個設(shè)備可以有一個或者多個活動的渲染目標(biāo)，可以通過SetRenderTarget來啟用。一個用于渲染目標(biāo)的表面只能放在Default池中，有三種渲染目標(biāo)：

· 渲染目標(biāo)表面Render target surfaces（通過CreateRenderTarget創(chuàng)建）

· 渲染目標(biāo)紋理Render target textures（tongguo D3DUSAGE_RENDERTARGET標(biāo)識來創(chuàng)建）

· 交換鏈Swap chains 交換鏈就是后備緩沖的集合，它們能夠相繼渲染到前緩沖，也就是屏幕上。一個在交換鏈中的后備緩沖可以當(dāng)作一個渲染目標(biāo)賦給一個設(shè)備。但是，不像其他的渲染目標(biāo)，交換鏈可以渲染到屏幕上，因?yàn)榻粨Q鏈?zhǔn)呛痛翱?全屏大小綁定的。可以創(chuàng)建多個交換鏈，注意更改默認(rèn)交換鏈大小會造成設(shè)備丟失，所以窗口程序會忽略默認(rèn)的交換鏈，而使用一個附加的交換鏈來避免這個問題。渲染目標(biāo)可以被鎖定（用來讀取），但是當(dāng)這個渲染目標(biāo)是活動的話，會影響系統(tǒng)性能。我們可以根據(jù)需要用IDirect3DDevice9::GetRenderTargetData來將一個在Default池中的渲染目標(biāo)拷貝出來。可以使用IDirect3DDevice9::StrechRectangle在兩個在顯卡內(nèi)存中的渲染目標(biāo)中進(jìn)行高效拷貝。

批處理（Batching）【重劍注：這個是重點(diǎn)】

D3D的效率在很大程度上受制于傳給API的幾何模型數(shù)據(jù)的批次上。一個批處理就是調(diào)用一次DrawPrimitive或者DrawIndexPrimitive。在GPU可以處理數(shù)據(jù)前，CPU花相當(dāng)長時間來處理每批數(shù)據(jù)。現(xiàn)在常見的CPU和GPU，可以參考以下數(shù)據(jù)：

· 使用DX9，CPU每秒可以處理50,000批次；使用DX10，這個數(shù)據(jù)是200,000。

· 在DX9中，處理2,000個三角形在CPU和GPU所花的時間大致相等。在DX10中，這個數(shù)據(jù)是500。簡單的著色程序使這個數(shù)字增加，復(fù)雜的著色程序使這個數(shù)字減少。在CPU和GPU在同一個批次上花相同時間的情況下，實(shí)例化（Instancing）可以提高三角形的輸出能力。因?yàn)橐陨显颍總€批次中處理數(shù)據(jù)的數(shù)量越大越好，這樣能夠?qū)⑷切蔚耐掏铝孔畲蠡?/p>

在實(shí)踐中，具體有兩種方式：

· Consolidation合并：將相同性質(zhì)的幾何元素合并起來，通常是將一些屬性進(jìn)行排序的結(jié)果

· Instancing實(shí)例化：將相同的幾何物體，經(jīng)過一些細(xì)微的，不同的變換后畫出多個實(shí)例來。例如世界坐標(biāo)系的轉(zhuǎn)換和顏色轉(zhuǎn)換。【重劍思考：Q:游戲里角色的護(hù)腕部位要同樣的模型，不能是一個護(hù)腕，一個手套，這個就是為了Instancing？A:非也！兩個護(hù)腕其實(shí)是一個模型，美術(shù)畫的時候就是畫了一對（左右各一個），中間就是斷開的】

頂點(diǎn)，索引緩沖Vertex / Index Buffer

頂點(diǎn)和索引緩沖有兩種類型：靜態(tài)和動態(tài)的。

一旦創(chuàng)建之后，靜態(tài)的緩沖使用起來比動態(tài)的快一倍。但是，動態(tài)緩沖的加鎖和解鎖要比靜態(tài)的快，它們是為更改的每一幀設(shè)計(jì)的，通常被存儲在AGP卡槽內(nèi)存中。經(jīng)常對靜態(tài)緩沖加解鎖是不明智的，因?yàn)橹挥械闰?qū)動完成了所有掛起的命令之后才能返回該緩沖的指針。如果經(jīng)常這樣做，這會導(dǎo)致CPU和GPU很多不必要的同步，這樣性能將會變得很差。

為了得到最好的性能，必須采用動態(tài)緩存。這樣驅(qū)動可以繼續(xù)進(jìn)行并行渲染。使用DISCARD或者是NOOVERWRITING標(biāo)志可以實(shí)現(xiàn)這一點(diǎn)，這樣驅(qū)動可以在更新數(shù)據(jù)的同時繼續(xù)處理老的數(shù)據(jù)。

DISCARD：這個標(biāo)志說明應(yīng)用程序不關(guān)心當(dāng)前緩沖的內(nèi)容。所以在緩沖被渲染的同時，驅(qū)動可以給應(yīng)用程序一個全新的緩沖。這個處理稱之為“buffer renaming”。注意，在實(shí)踐中，驅(qū)動傾向于不去釋放“緩沖重命名”中所用的內(nèi)存，因此這個標(biāo)志必須盡量少用。

NOOVERWRITE：這表示，對于之前添加的，不帶這個標(biāo)志的數(shù)據(jù)，應(yīng)用程序不會更改它。例如應(yīng)用程序只會在現(xiàn)有緩沖之后添加數(shù)據(jù)。所以驅(qū)動可以繼續(xù)使用現(xiàn)有數(shù)據(jù)進(jìn)行渲染。

CPU和GPU的并行處理

D3D runtime會將一堆命令做成命令串傳給GPU，這就允許GPU和CPU進(jìn)行并行處理。這樣也是硬件加速渲染這么高效的原因之一。但是，在很多情況下，CPU和GPU必須進(jìn)行同步之后才能做進(jìn)一步的處理。通常來說，應(yīng)該盡量避免這種情況，因?yàn)檫@會導(dǎo)致整個流水管線的刷新，大幅降低性能。例如，對靜態(tài)緩沖加鎖，這要求GPU先處理完所有的命令之后，才能返回被鎖緩沖的指針。如果用動態(tài)緩沖，就可以避免，就像前面講過的一樣。

有一些同步是不可避免的，例如，CPU可能會需要一些GPU還來不及處理的命令結(jié)果。在這種情況下，用戶會感到畫面延遲Lag。要避免這種情況，可以在GPU落后兩三幀的情況下調(diào)用Present來強(qiáng)迫CPU等待GPU。因此，調(diào)用Present可能比較慢，但是正式它處理了必要的同步。

狀態(tài)的更換State Changes

不管冗余還是不冗余，狀態(tài)的轉(zhuǎn)換在到達(dá)驅(qū)動層的時候，開銷總是很大。所以在某些層面，狀態(tài)轉(zhuǎn)換必須被過濾。一個對狀態(tài)進(jìn)行更換的函數(shù)調(diào)用并不一定會開銷很大，因?yàn)镈3D Runtime很有可能緩沖這些轉(zhuǎn)換請求，在真正調(diào)用DrawPrimitive函數(shù)之前不會去執(zhí)行它。多次的狀態(tài)轉(zhuǎn)換也不會加大開銷，因?yàn)橹皇褂米詈笠粋€狀態(tài)值。盡管如此，狀態(tài)轉(zhuǎn)換還是應(yīng)該盡量避免。某些狀態(tài)轉(zhuǎn)換會比其他的轉(zhuǎn)換的開銷更大。例如，對于更改處于活動狀態(tài)的頂點(diǎn)緩沖和像素緩沖會導(dǎo)致整個流水管線的刷新。因?yàn)樵谀承╋@卡上，同一時間每個類型只有一個著色器可以處于活動狀態(tài)。一個圖形流水線可以很長，花一段時間才能完成一個像素的渲染。因此，整個流水線的刷新需要盡量避免。在不同的顯卡上，某個狀態(tài)的更新的花費(fèi)差別可能會很大。另外，D3D的函數(shù)調(diào)用個數(shù)也必須盡量的少，雖然它的開銷不如達(dá)到驅(qū)動層的狀態(tài)更改那么大。可以使用狀態(tài)塊來減少D3D API的調(diào)用，狀態(tài)塊可以將狀態(tài)的更改集中在一起，并且可以重用。

注意這段 3.3.4 Batching with the Geometry Instancing API

Inside Geometry Instancing（上）
Inside Geometry Instancing（下）

注意這個

GPU Gems 2 Chapter 3. Inside Geometry Instancing

的

3.5 References

Wloka, Matthias. 2003. "Batch, Batch, Batch: What Does It Really Mean?" Presentation at Game Developers Conference 2003. http://developer.nvidia.com/docs/IO/8230/BatchBatchBatch.pdf

看完這些，理解得差不多了。再結(jié)合現(xiàn)在的引擎代碼具體理解下。理解了才好辦事！

posted on 2009-09-23 17:58 七星重劍閱讀(5477) 評論(2) 編輯收藏引用所屬分類: Game Graphics

FeedBack:

# re: 理解D3D--(0)批次batch 2011-06-10 10:24 trcj

不錯;) 回復(fù) 更多評論

# re: 理解D3D--(0)批次batch 2011-10-30 15:47 ljb

不錯！繼續(xù) 回復(fù) 更多評論

刷新評論列表

只有注冊用戶登錄后才能發(fā)表評論。


相關(guān)文章: 理解D3D--(0)批次batch 《天驕3》不錯 Vertex Formats 3D地形多層紋理混合加陰影渲染方法在游戲全屏模式下調(diào)試的解決辦法《Advanced Animation with DirectX》源碼編譯不過的解決辦法 WildMagic4p7 野豬寫的《游戲程序中的骨骼插件》 WOW m2模型與WowModelViewer 圖形學(xué)掃盲--(6)凹凸貼圖Bump mapping

網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品