国产伦精品一区二区三区视频孕妇,午夜精品久久久久久久蜜桃app ,久久久久久一区

Directional Light Map(Directional Irradiance)

Light Map是一個比較經典的技術，目前來說應該是一般游戲引擎中的標配，它很好的在一種擬全局光效果的質量和效率上做了中和。不過目前用的更多、質量更好的應該是Directional Light Map，它是原始LM的增強版，通過在預處理與實時還原中考量場景中表面的法向量進而增強效果。DLM的基本操作方法如下：

在采樣點處把其半球空間中的輻射照度用某種方法進行采集并保存（比如離線的光線跟蹤）；
以某種方法存儲額外的、與該輻射照度相關的法線信息到光照貼圖中；
實時渲染中通過光照貼圖對像素上的場景輻照度進行還原（結合光照信息與方向信息）。

目前常用的DLM實現方法主要有三種：

Radiosity Normal Maps

該方法最早是在Valve的Source引擎中用的一種模式，它的原理應該是一種擬信號壓縮與重建的方法：

在采樣點處選取三個正交的采樣方向作為基方向，采樣得到這些方向上的光照信息并保存（壓縮）；
實時渲染中通過三個方向及其上的光照值做為基函數，對實際表面法向上的光照值進行還原（重建）。

其中的三個基方向（表面法向所在的局部切空間，如下圖示）分別為：

$\small \inline \fn_cm V_{0} = \{\sqrt{\frac{2}{3}} , 0 , \sqrt{\frac{1}{3}} \}$ ， $\small \inline \fn_cm V_{1} = \{-\sqrt{\frac{1}{6}} , \sqrt{\frac{1}{2}} , \sqrt{\frac{1}{3}} \}$ ， $\small \inline \fn_cm V_{2} = \{-\sqrt{\frac{1}{6}} , -\sqrt{\frac{1}{2}} , \sqrt{\frac{1}{3}} \}$

對應的還原計算為：

$\small \fn_cm C=C_{0}\cdot <V_{0},N>+ C_{1} \cdot <V_{1},N>+ C_{2} \cdot <V_{2},N>$

Valve的這種方法應該說還是很不錯的，雖然數學理論依據不太充分，但至少看起來效果很不錯，而且實現簡單，效率較高。不過其也會出現一些問題，那就是當法線的方向與采樣光照的主方向夾角較大（即與采樣切平面的夾角較小時）容易出現一些不太正確的光照還原。

Dominant Directional Irradiance

該方法的原理可以是看作將采樣點半球空間中的輻照信息處理為一個方向光（Directional Irradiance），這樣在實時渲染中就可以使用反射模型進行快速還原；其中的Dominant axis就可以看作是指該平行光的方向。其操作如下：

外理采樣點外部輻照信息為：方向光（方向：L，顏色：C_L）；
渲染中直接反射模型模型來還原。

比如使用Lambert模型時對應的還原計算為：

$\small \fn_cm C = C_{L}\cdot <L , N>$

另外，一般情況下也會使用方向貼圖的空閑的Alpha通道來存儲一個縮放因子，用其來控制該點上外部輻照度的方向性（即被dominant方向影響的力度）。當然，這里也可以使用其它更復雜的一些shading model來操作，不過Lambert已經足夠了。該方法的計算量相對也比較小；存儲空間也比較節省，只需要在傳統LM的基礎上再存儲一張方向貼圖就可以了（目前來說該方法較為流行，比如UE或Enlighten中就使用此方法）。

Spherical Harmonics

該方法與Radiosity Normal Map的方法類似（同樣與Light Probe的原理類似），只不過這里使用了理論與數學依據更為充分的球諧函數來實現外部輻射照度信息的壓縮與重建：

把光照函數使用球諧函數進行變換存儲（壓縮）；
實時渲染中使用時直接利用SH重建進行還原即可（還原）。

這種方法比上述兩種方法都更為高級，一般來說對于任意Normal上的照度信息都能正確還原，而且適應性較強，較為靈活；但同時有很大的缺點那就是存儲空間較大（其LM中每個Pixel中存儲的數據量相當于一個Light Probe對應的存儲的內容），因而其應用范圍就有所限制。

下述是LM與DLM的簡單效果對比，差異還是相當明顯的：

http://blog.csdn.net/bugrunner/article/details/7881819

posted @ 2013-04-01 00:11 麒麟子閱讀(606) | 評論 (0) | 編輯收藏

irrlicht引擎：硬件蒙皮骨骼動畫

這個東西很順利，僅用了半小時就找到了方法，最應該感謝的還是Super TuxKart(簡稱STK，下面就都用這三字母了). 如果不明白STK，同時又對它感興趣的童鞋，可以訪問這里

http://supertuxkart.sourceforge.net/

由于墻的原因，需要各位搭梯子。

上周末，在弄換裝的時候，發現irrlicht引擎本身是不支持硬件蒙皮的，多少令人有些失望。心里就一直尋思著怎么擴展一下，將它弄出來。

值得說明的是STK對irrlicht引擎的用法是很簡單的，基本上可以說是裸用，并未在irrlicht接口上做修改。而是對外進行了一些必要的擴展。

當然，STK也對外開放了一個irrlicht.dll，說是修改了其中的BUG。但直接使用irrlicht是可以的。

廢話不多說，來說說如何不修改irrlicht一行代碼，通過外部擴展來實現硬件骨骼動畫吧

首先，能夠使我們不修改irrlicht代碼的原因，是因為ISkinnedMesh提供了一個setHardwareSkinning接口，默認為false.

雖然這個接口的說明是"(This feature is not implemented in irrlicht yet)”，但并不代表，設置與不設置無差別。

查看代碼可以發現，當你設置了這個為true以后，irrlicht就完全不管你的動畫了。意思就是，要是你非要讓我干我不干不了的事，那就只有您另請高明了。

irrlicht連CPU計算都不會參與。這正好讓我們有機可乘，完全用GPU接管。

而要讓一個頂點參與骨骼計算，那骨骼索引則是少不了的。所以，我們需要想辦法讓頂點數據能夠將骨骼索引代入SHADER中。

在STK中用了一種巧妙的方法，就是使用了頂點的顏色數據，雖然這樣一來，頂點顏色就用不了了。但在模型渲染時，頂點顏色很少被使用到的。也就是說，頂點顏色在STK的動畫模型中，被用作了骨骼索引。

初始化骨骼索引的方法很簡單，用下面的代碼遍歷即可。

設：我們有一個骨骼動畫模型是 ISkinnedMesh* pSkinnedMesh = …

那么：初始化代碼如下

for(u32 i = 0;i < pSkinnedMesh ->getMeshBuffers().size();++i)
{
    for(u32 g = 0;g < pSkinnedMesh ->getMeshBuffers()[i]->getVertexCount();++g)
    {
        pSkinnedMesh ->getMeshBuffers()[i]->getVertex(g)->Color = video::SColor(0,0,0,0);
    }
}

//初始化完畢以后，就是需要真正的索引賦值了，通過以下代碼可以完成

const core::array<scene::ISkinnedMesh::SJoint*>& joints = pSkinnedMesh ->getAllJoints();
for(u32 i = 0;i < joints.size();++i)
{
    const core::array<scene::ISkinnedMesh::SWeight>&    weights = joints[i]->Weights;
    for(u32 j = 0;j < weights.size();++j)
    {
        int buffId = weights[j].buffer_id;

int vertexId = pSkinedMesh->getAllJoints()[i]->Weights[j].vertex_id;
video::SColor* vColor = &pSkinedMesh->getMeshBuffers()[buffId]->getVertex(vertexId)->Color;

        if(vColor->getRed() == 0)
            vColor->setRed(i + 1);
        else if(vColor->getGreen() == 0)
            vColor->setGreen(i + 1);
        else if(vColor->getBlue() == 0)
            vColor->setBlue(i + 1);
        else if(vColor->getAlpha() == 0)
            vColor->setAlpha(i + 1);
    }
}

//經過以上兩個步驟，頂點數據改造完成。值得注意的是，在這里，索引 0 是被認為是無效的

然后，我們來創建一個SHADER作為渲染。

假設我們將這個pSkinnedMesh綁定了到了一個IAnimatedSceneNode* node 上。

那，我們為這個結點創建一個材質在創建材質前，我們需要準備一個SHADER回調。 SHADER回調就像下面一樣就可以了。

class HWSkinCallBack:public video::IShaderConstantSetCallBack
{
    scene::IAnimatedMeshSceneNode* m_pNode;
public:
    HWSkinCallBack(scene::IAnimatedMeshSceneNode* node):m_pNode(node)
    {

    }
    virtual void OnSetConstants(video::IMaterialRendererServices* services,
        s32 userData)
    {
        scene::ISkinnedMesh* mesh = (scene::ISkinnedMesh*)m_pNode->getMesh();
        f32 joints_data[55 * 16];
        int copyIncrement = 0;

        const core::array<scene::ISkinnedMesh::SJoint*> joints = mesh->getAllJoints();
        for(u32 i = 0;i < joints.size();++i)
        {
            core::matrix4 joint_vertex_pull(core::matrix4::EM4CONST_NOTHING);
            joint_vertex_pull.setbyproduct(joints[i]->GlobalAnimatedMatrix, joints[i]->GlobalInversedMatrix);

            f32* pointer = joints_data + copyIncrement;
            for(int i = 0;i < 16;++i)
                *pointer++ = joint_vertex_pull[i];

copyIncrement += 16;
}

services->setVertexShaderConstant("JointTransform", joints_data, mesh->getAllJoints().size() * 16);
}
};

好了，現在我們來創建一個材質

s32 hwskm = gpu->addHighLevelShaderMaterialFromFiles(
"../../skinning.vert","main",video::EVST_VS_2_0,
"","main",video::EPST_PS_2_0,&hwc,video::EMT_SOLID);

//用新創建出來的材質賦值給這個結點

node->setMaterialType((video::E_MATERIAL_TYPE)hwskm );

//到此，設置完畢。

//最后，就是skinning.vert本身的內容了。貼出來即可，沒有太多技巧，就是一個普通的蒙皮。

// skinning.vert

#define MAX_JOINT_NUM 36
#define MAX_LIGHT_NUM 8

uniform mat4 JointTransform[MAX_JOINT_NUM];

void main()
{
    int index;
    vec4 ecPos;
    vec3 normal;
    vec3 light_dir;
    float n_dot_l;
    float dist;

    mat4 ModelTransform = gl_ModelViewProjectionMatrix;
    index = int(gl_Color.r * 255.99);
    mat4 vertTran = JointTransform[index - 1];
    index = int(gl_Color.g * 255.99);
    if(index > 0)
        vertTran += JointTransform[index - 1];

    index = int(gl_Color.b * 255.99);
    if(index > 0)
        vertTran += JointTransform[index - 1];
    index = int(gl_Color.a * 255.99);
    if(index > 0)
        vertTran += JointTransform[index - 1];
    ecPos = gl_ModelViewMatrix * vertTran * gl_Vertex;
    normal = normalize(gl_NormalMatrix * mat3(vertTran) * gl_Normal);
    gl_FrontColor = vec4(0,0,0,0);
    for(int i = 0;i < MAX_LIGHT_NUM;i++)
    {
        light_dir = vec3(gl_LightSource[i].position-ecPos);
        n_dot_l = max(dot(normal, normalize(light_dir)), 0.0);
        dist = length(light_dir);
        n_dot_l *= 1.0 / (gl_LightSource[0].constantAttenuation + gl_LightSource[0].linearAttenuation * dist);
        gl_FrontColor += gl_LightSource[i].diffuse * n_dot_l;
    }
    gl_FrontColor = clamp(gl_FrontColor,0.3,1.0);

    ModelTransform *= vertTran;
    gl_Position = ModelTransform * gl_Vertex;
    gl_TexCoord[0] = gl_MultiTexCoord0;
    gl_TexCoord[1] = gl_MultiTexCoord1;
    /*
    // Reflections.
    vec3 r = reflect( ecPos.xyz , normal );
    float m = 2.0 * sqrt( r.x*r.x + r.y*r.y + (r.z+1.0)*(r.z+1.0) );
    gl_TexCoord[1].s = r.x/m + 0.5;
    gl_TexCoord[1].t = r.y/m + 0.5;
    */
}

//注：這是GLSL 2.0，在用IRR做測試的時候，要選GL驅動方式。

還是上個圖吧，不上圖感覺沒有真像。雖然圖看不出來什么動作

為了說明它真的在動，不得不上第二張。

在此，十分感謝Super Tux Kart. 提供了一個學習和擴展irrlicht的榜樣.

posted @ 2013-03-26 00:08 麒麟子閱讀(3373) | 評論 (0) | 編輯收藏

irrlicht引擎：實現天龍八部的RPG角色換裝

看了看時間，已經3點過了，突然想寫點什么，卻又不知從何說起。

那就從今天這個用irrlicht做天龍八部的模型換裝說起吧。

也不知道是為什么，最近又搗鼓起了OGRE和irrlicht. 并且，總想用irrlicht實現一些OGRE中的東西。

當然，這不是商業項目，也沒有商業目的，純屬蛋疼而已。

一切行動的由來，都來自于vczh那天晚上的舉動。

記得有一天晚上在群里聊天，大伙就稱贊各位菊苣是多么的厲害。

最后vc發了一個自己的桌面截圖說：讓你們看看菊苣是如何練成的（這不是原話，和話的字眼有出入，在此不想負任何責任，如果真有想看的，去翻群的聊天記錄）

那天晚上，我想了很久。想想自己自從轉做頁游以后，是如何虛渡光陰的。

終于忍不住了，翻開了自己的移動硬盤，看看自己曾經做過的小東西。90%是建好工程就沒理了。

這才明白，我花在思考上的時間遠遠大于了行動。于是，我決定改變自己，找回那個真的我。

3D游戲是我的真愛，真愛到就算畫面差一點，只要是3D，我也會很喜歡。

于是，我覺得自己還是應該接著先前的路走下去。什么服務器，什么 AS3. 都是浮云，不喜歡就是不喜歡。

私下又開始研究irrlicht了。

猛地一發現，自己是多么的搞笑，從09年到11年，一直在做引擎開發，也翻過irrlicht和ogre無數遍。卻從來就沒有寫完過一個完整的DEMO。

連功能測試用例都沒有寫過。突然覺得之前的一些設計似乎有些脫離了實際。沒有真正使用過，又怎知如何是好，如何是壞呢？

這一次是真的玩irrlicht了，中間也糾結過是不是OGRE更適合。但在目前這個時間有限的空間下，我更愿意玩irrlicht.小巧，輕便。當然，意味著更多東西要自己實現。不過對于一個代碼控來說，也反而更自得其樂。正好可以在短路的時候，去參考一下其它引擎，用來擴充irrlicht.

我要做的不是把irrlicht整得牛B，而是想自己弄弄，加上移動平臺的崛起，我覺得irrlicht更加適合吧。據說gameloft也有使用（僅是據說）。

可能很多兄弟會說我這講的東西，其實就是一坨屎了。不過，我覺得再壞的評論，也表示一種關注。批評好過于無視啊~~~~

----------------------------------------------------------下面說說我遇上的糾結------------------------------------------------

糾結1:換裝需要場景節點配合

在irrlicht中，并沒有提供普通引擎中的submesh或者bodypart這種東西，用于直接支持換裝。在irrlicht中，如果想要換裝，最直接的方法就是依賴于場景結點

比如,在我的示例中，可以更換頭發，帽子，衣服，護腕，靴子，面容。那就需要7個場景節點，1個作為根節點，用于控制整個角色的世界坐標，平移，縮放，旋轉等屬性。另外6個場景節點則分別綁有各個部件的模型

貼一下我的角色類的代碼，行數不多

class CCharactor
{
    IrrlichtDevice* m_pDevice;
    IAnimatedMeshSceneNode* m_pBodyParts[eCBPT_Num];
    ISceneNode* m_pRoot;
public:
    CCharactor(IrrlichtDevice* pDevice)
        :m_pDevice(pDevice)
    {
        memset(m_pBodyParts,0,sizeof(m_pBodyParts));
        m_pRoot = pDevice->getSceneManager()->addEmptySceneNode(NULL,12345);
    }
    void changeBodyPart(ECharactorBodyPartType ePartType,stringw& meshPath,stringw& metrialPath)
    {
        ISceneManager* smgr = m_pDevice->getSceneManager();

        IAnimatedMeshSceneNode* pBpNode = m_pBodyParts[ePartType];
        IAnimatedMesh* pMesh = smgr->getMesh(meshPath.c_str());
        if(pMesh==NULL)
            return;

        if(pBpNode==NULL)
        {
            pBpNode = smgr->addAnimatedMeshSceneNode(pMesh,m_pRoot);
            m_pBodyParts[ePartType] = pBpNode;
        }
        else
        {
            pBpNode->setMesh(pMesh);
        }
        ITexture* pTexture = m_pDevice->getVideoDriver()->getTexture(metrialPath.c_str());
        if(pTexture)
            pBpNode->setMaterialTexture(0,pTexture);
    }
};

//然后，我用了一個結構體來構建部件信息

struct SBodyPartInfo
{
    stringw Desc;
    ECharactorBodyPartType Type;
    stringw MeshPath;
    stringw MeterialPath;
};

糾結2：共享骨骼

首先，irrlicht 1.8中對OGRE模型的格式支持在代碼中，最高只看到了1.40版本的解析，更高的就會被無視。天龍八部的模型有幾個是1.30的，而用于換裝和主角的，都是1.40的。可能是解析不全的原因，導致1.40的骨骼動畫無法正常播放。這個問題整了幾個小時，沒有解決，明天繼續

其次，多個模型共享骨骼只能通過場景節點的useAnimationFrom來完成，并且傳入的是一個Mesh參數。這點讓人蛋疼，天龍八部的角色動作是分開了的，不同的攻擊動作是一個skeleton文件。想要實現共享，有點麻煩。

糾結3：模型文件格式

irrlicht不像OGRE那樣有一個強大且成熟的模型文件格式,雖然提供了.irr格式，但僅是用于irrEdit的場景信息輸出。先看一張圖

這張圖是irrlicht samples中的MeshViewer的提示框內容。上面列出了可以支持的模型文件類型。大家可以看看，又有多少模型格式是可以直接拿來放到項目上用的呢？ mdl和ms3d可以考慮，dae的話，我在開源游戲0 A.D. 中見到使用過。其它的話，就完全不熟悉了。 OGRE的 .mesh支持也不完全。難道真要自己整一個。

我能想到的，就是選一個插件完整和模型和動畫格式都比較好的作為與美術工具交互的格式。自己再寫一個工具，轉換成自己的格式。

糾結4：硬件蒙皮

我以為像NIKO那樣的技術狂，怎么會放掉這一個特性。很高興地在場景節點上發現了硬件蒙皮的函數接口。但一看注釋，把我咽著了。

//! (This feature is not implemented in irrlicht yet)
virtual bool setHardwareSkinning(bool on);

其它地方，還沒有去整，就先不發表言論了。繼續著這個很傻B,很天真的搗鼓之路。

上個圖，紀念一下我的irrlicht產物。

布衣

換了身盔甲

換了帽子和靴子

PS:頭發沒有紋理，所以是白的。

posted @ 2013-03-24 04:08 麒麟子閱讀(3681) | 評論 (0) | 編輯收藏

請教大家一個關于EPOLLET和EPOLLLT的問題

今天在查看EPOLLET和EPOLLLT的細節的時候，發現一篇文章。但不知文中說的是否有道理，望各位大大給個明確的答復。
游戲服務器，我們用的是ET方式。

剖析 epoll ET/LT 觸發方式的性能差異誤解（定性分析）

平時大家使用 epoll 時都知道其事件觸發模式有默認的 level-trigger 模式和通過 EPOLLET 啟用的 edge-trigger 模式兩種。從 epoll 發展歷史來看，它剛誕生時只有 edge-trigger 模式，后來因容易產生 race-cond 且不易被開發者理解，又增加了 level-trigger 模式并作為默認處理方式。
二者的差異在于 level-trigger 模式下只要某個 fd 處于 readable/writable 狀態，無論什么時候進行 epoll_wait 都會返回該 fd；而 edge-trigger 模式下只有某個 fd 從 unreadable 變為 readable 或從 unwritable 變為 writable 時，epoll_wait 才會返回該 fd。
通常的誤區是：level-trigger 模式在 epoll 池中存在大量 fd 時效率要顯著低于 edge-trigger 模式。
但從 kernel 代碼來看，edge-trigger/level-trigger 模式的處理邏輯幾乎完全相同，差別僅在于 level-trigger 模式在 event 發生時不會將其從 ready list 中移除，略為增大了 event 處理過程中 kernel space 中記錄數據的大小。
然而，edge-trigger 模式一定要配合 user app 中的 ready list 結構，以便收集已出現 event 的 fd，再通過 round-robin 方式挨個處理，以此避免通信數據量很大時出現忙于處理熱點 fd 而導致非熱點 fd 餓死的現象。統觀 kernel 和 user space，由于 user app 中 ready list 的實現千奇百怪，不一定都經過仔細的推敲優化，因此 edge-trigger 的總內存開銷往往還大于 level-trigger 的開銷。
一般號稱 edge-trigger 模式的優勢在于能夠減少 epoll 相關系統調用，這話不假，但 user app 里可不是只有 epoll 相關系統調用吧？為了繞過餓死問題，edge-trigger 模式的 user app 要自行進行 read/write 循環處理，這其中增加的系統調用和減少的 epoll 系統調用加起來，有誰能說一定就能明顯地快起來呢？
實際上，epoll_wait 的效率是 O(ready fd num) 級別的，因此 edge-trigger 模式的真正優勢在于減少了每次 epoll_wait 可能需要返回的 fd 數量，在并發 event 數量極多的情況下能加快 epoll_wait 的處理速度，但別忘了這只是針對 epoll 體系自己而言的提升，與此同時 user app 需要增加復雜的邏輯、花費更多的 cpu/mem 與其配合工作，總體性能收益究竟如何？只有實際測量才知道，無法一概而論。不過，為了降低處理邏輯復雜度，常用的事件處理庫大部分都選擇了 level-trigger 模式（如 libevent、boost::asio等）
結論：
• epoll 的 edge-trigger 和 level-trigger 模式處理邏輯差異極小，性能測試結果表明常規應用場景中二者性能差異可以忽略。
• 使用 edge-trigger 的 user app 比使用 level-trigger 的邏輯復雜，出錯概率更高。
• edge-trigger 和 level-trigger 的性能差異主要在于 epoll_wait 系統調用的處理速度，是否是 user app 的性能瓶頸需要視應用場景而定，不可一概而論。
歡迎就此話題進行深入調研、討論！
參考資料：
• linux kernel source：fs/eventpoll.c
• “Comparing and Evaluating epoll, select, and poll Event
Mechanisms”：http://bcr2.uwaterloo.ca/~brecht/papers/getpaper.php?file=ols-2004.pdf
• “Edge-triggered interfaces are too difficult?”：http://lwn.net/Articles/25137/
By QingWu

posted @ 2013-02-25 13:05 麒麟子閱讀(7812) | 評論 (1) | 編輯收藏

ID Tech 5 中"Megatexture"針對地形的D3D9 基本實現原理

ID Tech 5 中"Megatexture"針對地形的D3D9
基本實現原理
姚勇
H3D
2007－8
本文對ID SOFTWARE 使用的"megatexture"技術，針對地表貼圖應用的D3D9 的硬件實
現，做了概要式的介紹。并對技術的實現，優化，擴展，和實用性進行了刨析。轉載請注名
作者和H3D。
一，綜述
ID TECH5是PC 3D游戲之父和DOOM之父John Carmack最新推出的一項新的游戲制作
技術。核心內容為一種命名為"Megatexture"的動態貼圖管理技術。實際上是一種動態卸載和
裝載渲染資源的技術統稱。Idsoftware DOOM3引擎的lighting/shadow/shader方案統一以后，
同UNREAL3一樣，面對次世代游戲對資源的無窮盡需求，需要盡快建立起一種實際工程技術
方案，加快構建3D虛擬現實的生產。

圖片來源：Quake Wars
這個技術最主要方向就是要把VR3D建造從有限的顯卡內存中釋放出來。把美術從繁重
的貼圖重用繪制中解脫出來。因為VR3D主要資源消耗都在貼圖上，所以這個技術主要針對
texture。同時geometry也可以作為動態資源。一旦rendering相關資源作為動態流進行管理，
所帶來的另一個好處就是可以讓VR世界變為動態的。隨時改變texture/geometry。
總得來講，ID這項針對工程應用技術主要致力于解決：1-3DVR資源需求的爆炸增長和
有限顯卡顯存的矛盾；2-美術資源需求的爆炸增長，以及生產力低、成本高昂的矛盾
在ID TECH5演示中，實時演算播放了一個細節非常豐富的室外地形，同時結合了一個
小型的室內場景。所有模型和貼圖制作，按照Carmack介紹，只讓幾個美術花了4天時間。
就制作出20G的游戲美術資源。而游戲引擎負責把幾十G的資源動態裝載到顯卡進行渲染。
本文就以下幾個問題做初步講述：1，綜述地形渲染以及貼圖技術；2，Clipmap介紹；
3，基于D3D9的解決方案描述；4，優化和擴展；5，方案可行性
1-1
，
Mega
Texture
Megatexture 的具體實現，在DOOM3 中的地形繪制已經加入。具體實現細節簡單描述
如下：
DOOM3 的地形貼圖最大支持32768x32768 。即5.46 G。在DOOM3 中，以128x128
大小的塊進行儲存便于快速讀取。以最大2048x2048 的clipmap 尺寸進行處理。其實可以計
算出在D3D9 標準的顯卡上，normalmap+6 clipmap stack 的最大理論支持貼圖數據大小為
（2048 * 2^6 ）^2 *4= 68T bytes. 這個大小針對現在的PC 硬盤是綽綽有余的。
DOOM3 使用這張全局metatexture 紋理渲染地形，不使用LOD，GEOM-MORPHING。
1-2
，
傳統
地形貼圖渲染
當使用Tiling 方式繪制貼圖，等于把貼圖圖素(texel)密度成倍擴大。以重復紋理信息量
的代價保證在一定分辨率下屏幕上貼圖的精細程度。在繪制大范圍地形時，使用不Tiling 的
全局貼圖無法表現貼地處的地表細節。所以使用一些可以重復(Tiling)的不規則圖案的貼圖
來進行模擬。
1-2-1
Tiling
地形貼圖
由于地形貼圖尺寸很大，所以無法使用全局貼圖。而是把多層Tiling 的紋理使用alpha
通道互相融合起來。諸如WOW[1]，天堂2 等大型室外地形渲染多采用此技術。此技術在每
一層Tiling 貼圖依然用到了一張全局alpha 貼圖。以及一張全地形唯一的靜態光影貼圖。在
multitexture 中根據顯卡的multitexture 處理單元數量，進行multi-pass 和multitexture 的混合
渲染。
比如，混合綠草，土路，野花的一塊室外地形，需要至少3 層地表貼圖。分別是一塊
256x256 的草貼圖，128x128 的土路貼圖，和128x128 的野花貼圖。每層紋理使用Tiling 模
式進行繪制，在繪制的同時，每層紋理帶有一張ALPHA 灰度圖（第一層不用）。用來表明
本層紋理在融合中所占的比重。把3 張地表貼圖，2 張ALPHA 貼圖，以及一張LIGHTMAP
貼圖混合起來，就有如下地表效果。可以看出土路和草地之間的均勻過渡。

圖片來源：H3D
如果進行優化，4 層ALPHA 可以混合稱為一張貼圖。Lightmap 一張。那么也至少需要
2 張全局貼圖進行地表繪制。
1-2-2
全局地表紋理混合Tiling
細節貼圖[2]
在更大廣度的地形渲染，有時候需要一種更加快速的方法。在FAR CRY 引擎中，使用
了這個技術。簡單描述為，使用一張全局地表紋理，渲染地表所有植被和光影信息。在離視
點近的范圍內，使用一張表現當地地表細節的貼圖，以Tiling 方式進行融合疊加。這樣在細
節度上，以Tiling 方式的貼圖以高細節圖素紋理，掩蓋了下面那一層全局貼圖的粗糙顆粒。
總的來講，分層Tiling Alpha 混合地表貼圖，和全局地表混合Tiling 細節貼圖，兩種方
法都是靠貼圖的Tiling 來增大視點附近貼圖圖素的密度。防止比屏幕分辨率小的2 圖素之間
進行線性差值。影響真實感。
二，Clip
maps
基本介紹
針對受顯卡顯存制約，無法使用大尺寸貼圖進行繪制，1998年SGI公司發表了一篇名為
<The Clipmap: A Virtual Mipmap>[3]的論文。論文里詳細闡述了一種以有限硬件性
能，來實現相對無限大貼圖的渲染。論文是一整套硬件與軟件結合的方案。它可以實現以一
平方米一個圖素，用單一貼圖進行整個地球表面的渲染。并且結合硬件數據傳輸帶寬，以及
相應優化方法，魯棒的保證以任意速度漫游時保持在60Hz(針速率）。下面先對此技術做一定
簡要介紹。在第三節給出基于D3D9硬件的解決方案思路。下圖為Clipmap實現的美國國家地
圖實時漫游的一小部分。美國約塞米蒂國家公園(Yosemite National Park)南部的一半。整個
美國使用一張170G的貼圖。在顯卡中的clipmap貼圖緩存為16M。這個貼圖內存用量在今天
的PC硬件上是完全可以實現的。

圖片來源：<The Clipmap: A Virtual Mipmap>
2-1
，
Mipmap
工作原理及其分析
我們先從mipmap[4]工作原理分析開始。如圖：

圖片來源：<The Clipmap: A Virtual Mipmap>
Mipmap 的工作原理是，把一張貼圖按照2 的倍數進行縮小。直到1X1。把縮小的圖都
儲存起來。在渲染時，根據一個象素(pixel，注意pixel 和texel 區別。Pixel 是屏幕上一個點。
Texel 是貼圖上一個圖素)離眼睛位置的距離，來判斷從一個合適的圖層中取出texel 顏色賦
給象素。D3D 和OGL 都有想對應的API 控制接口。如下圖

圖片來源：<The Clipmap: A Virtual Mipmap>
通過觀察mipmap 工作原理我們可以發現，硬件總是根據眼睛到目標的距離，來選取最
適合當前屏幕象素分辨率的圖層。假設有一張32768x32768 mipmap 貼圖。當前屏幕分辨率
為1024×1024。眼睛距離物體比較近時，mipmap 最大也只可能從1024×1024 的mipmap
圖層選取texel。再次，當使用三線性過濾(trilinear)時，最大也只訪問到2048x2048 的圖層選
取texel，來和1024x1024 圖層中的圖素進行線性插值。
這樣一個基本事實告訴我們，在使用任何尺寸貼圖渲染任意距離的物體時，貼圖采樣只
會用到不大于屏幕分辨率2 倍的mipmap 層。根據這個事實，我們可以創建clipmap 對大尺
寸貼圖進行渲染時的優化。
2-2
，
Clipmap
原理
2-2-1
Clipmap
構建
在原始clipmap 論文中，clipmap 在顯卡內存中的構建如圖：

圖片來源：<The Clipmap: A Virtual Mipmap>
Clipmap Pyramid（clipmap 棱椎)是我們PC 顯卡中常見的mipmap 形式。Clipmap Stack
是不同于mipmap 實現的地方。橫線繪制的棱錐代表完整貼圖的mipmap 形式。但是在顯存
中，大于clipmap Pyramid 最高層尺寸的貼圖，都以clipmap pyramid 尺寸存放，但是相應的，
clipmap stack 中的貼圖代表的原始貼圖面積，一層比一層小。比如clipmap pyramid 最大
2048x2048。在之上一層，mipmap 表達是4096x4094 圖素。在clipmap stack 中，還是儲存
2048x2048 大小的貼圖。顯然此代表的就是mipmap 尺寸4096 的一半邊長，即原始面積的
1/4大小。依次推上去，每層都是下層代表面積的1/4。Clipmap pyramid最大邊長即為Clip
size
。
Clipmap 貼圖的中心點，在整張貼圖的位置坐標，我們稱為ClipCenter
。ClipCenter 由
當前攝像機在整個世界中的相對位置來決定。
實際中，目前D3D9 級別的PC 顯卡硬件并不支持這種儲存形式的mipmap。具體實現
方法將在第三章講解。
2-2-2
渲染Clipmap
在渲染中，針對一個Pixel，根據當前Pixel，找到相應的clipmap 層，如果處于clipmap
pyramid，直接按照mipmap 傳統方式采樣取圖素。如果處于clipmap stack，則把貼圖坐標根
據當前clipmap stack 代表整體面積的比例，進行縮放，得到對應位置圖素。這樣就可以正確
渲染屏幕上的任意物體。如下圖：

圖片來源：<The Clipmap: A Virtual Mipmap>
把CLIPMAP 所有圖層繪制出來，從正上方看，就是象北京二環內，二環，三環，四環
為分割。繪制中心區域的貼圖分辨率最大，但是代表的面積最小。繪制最外圍四環之外的貼
圖分辨率最小。是因為到了clipmap pyramid 層，一層就代表一張全局貼圖。但是分辨率已
經被縮小了很多倍。而分辨率最大的clipmap stack 頂層，由于尺寸必須保持clipmap pyramid
的最大尺寸，所以所代表的面積就小了很多。這種折中正是由于基于繪制屏幕上的任何物體
都不可能使用大于屏幕分辨率的貼圖尺寸，所以在顯存中只提供剛剛滿足繪制在一針內，從
一個視點看過去的所有場景（地形）分辨率的貼圖內容。
2-2-3
clima
p
LOD
計算以及每層貼圖坐標計算
給定一個根據ClipCenter換算過的貼圖坐標，下面需要計算出在屏幕上的一個物體的象
素，從clipmap中選取一層，索引貼圖圖素。由mipmap LOD（LOD數在本文用俗稱層數描述）
計算公式得知，clipmap LOD計算和mipmap一樣。并且可以保證任意pixel計算出來的climap
層必然落在clipmap stack中。一般PC 3D顯卡硬件計算都采用Heckbe算法。簡單描述如下：
LOD = log2[f(x, y)]; f(x,y)為屏幕x,y軸方向貼圖坐標變化率的最大值。貼圖坐標變
化率計算由屏幕象素X,Y坐標分別遞進一個象素單位的變化投影到貼圖坐標系得出。具體描
述參考[5]。
2-3
，存儲效率
Clipmap由于采用clipmap stack和clipmap pyramid結合的方式，使用clipsize為2^m的
clipmap，把一張2^n邊長貼圖容量從(4n+1 - 1)/3 字節下降為4m(n - m + 4/3) - 1/3 字
節。更具體的數據如下：
類型/邊長512 1024 4096 32768 67108864
Full Mipmap 682KB 2.7MB 42.7MB 2.7GB 10923TB
512 Clipmap 682KB 1.1MB 2.2MB 3.7MB 9.1MB
1024 Clipmap 682KB 2.7MB 6.7MB 12.7MB 34.7MB
2048 Clipmap 682KB 2.7MB 18.7MB 42.7MB 131.7MB
可見clipmap極大降低了顯卡內存對渲染超大容量貼圖的要求。目前D3D9的主流顯卡從
128M到256M不等。在1024的Clipsize下，幾乎所有顯卡都可以滿足要求。
2-4
，繪制整個地球表面的方案
--
虛擬
clipmap
（簡述）
當繪制國家或者星球表面這樣規模的實時渲染時，整張貼圖尺寸為2^26 的平方。這樣
一來，需要在顯卡硬件內部計算的工作，諸如貼圖坐標換算等都難以在精度為IEEE 32
FLOAT 下正確進行。
在原有clipmap 基礎上，在U,V 方向加入一個坐標偏移向量。在clipmap stack 的縱向方
向，加入一個偏移數值。形成如下圖解構:

圖片來源：<The Clipmap: A Virtual Mipmap>
系統只要能夠保證從圖中的3 種情況中正確尋址，就能夠保證超大貼圖的clipmap 渲染。
三，基于D3D9
的簡化實現
從之前對Clipmap 的描述中可以看出。現代D3D9 顯卡具備了渲染clipmap 的大部分功
能。唯一欠缺的是clipmap stack 的模擬。因為clipmap pyramid 就是一張標準的mipmap 貼
圖。所以D3D9 只要能夠把clipmap stack 模擬出來，使用shader model3 可以很容易的實現
clipmap。
3-1
，
Multitexture
我們利用顯卡硬件的multitexture 模擬clipstack。這是D3D9 簡化實現的最基本思想。
PC 顯卡支持clip pyramid。在pixel shader 中，如果想利用clipmap stack，就必須有某種途徑
讓pixel shader 使用除了clip pyramid 之外的貼圖。自然我們想到了使用multitexture。D3D9
標準顯卡應該支持最少8 層紋理單元（不支持的硬件很快會絕跡，所以可以不考慮）。假設
我們不使用法線貼圖進行凹凸象素光照。
使用第8 層裝載clip pyramid，使用2048x2048 32bit DDS 貼圖。從第一層到第七層我們
都可以使用clip stack 貼圖。這樣，分別裝載4096, 8192, 16384,32768,65536,131072,262144 邊
長mipmap 的clipmap。每一層占用2048x2048*4*/4*1.33 /1024 /1024 = 5.32Mb 。這樣一共8
層貼圖總共43MB 貼圖顯存，可以容納一張274TB 的貼圖。當我們使用每層1024×1024
貼圖時，使用12MB 顯存就可以模擬68TB 的貼圖。顯然對于游戲來講綽綽有余。注意這
里只是簡化計算，沒有把trilinear 考慮進去。
3-2
，
Toroidal addressing
在第四章我們將考慮優化和動態管理clipmap。我們知道用MULTITEXTURE 模擬的
clipmap 只是當前視角觀察的貼圖用量。當攝像機移動時，clipmap 的貼圖組必須同時更新。
除了最底層clipmap pyramid 貼圖不用更新，其他幾張clipmap stack 貼圖必須根據攝像機移
動，改變ClipCenter 位置。然后從磁盤上把clipcenter 周圍的貼圖調入。這涉及到顯存寫入
問題。可以想見當所有clipmap stack 貼圖同時頻繁裝載總共十幾MB 容量的內存，對于磁
盤IO 和顯存帶寬都是極大考驗。所以針對clipmap 更新特點，在貼圖尋址方面采用wrap 循
環尋址。然后對貼圖的更新采用如下方式：

圖片來源：NVSDK
3-
3，
p
ixel
shader
實現思想概要
由于有了第二章climpa 渲染的大概描述，以及前兩節關于clipmap stack 和貼圖尋址方
式，我們利用shader model 3 的pixel shader 功能可以直接實現具體算法。描述如下：
1，計算mipmap LOD。
2，計算光照
3，假如應該采樣clipmap pyramid，直接采樣，混合光照，完成
4，假如應該采樣clipmap stack 貼圖，重新計算貼圖坐標
5，根據mipamapLOD 選擇相應的stack 貼圖。采樣，混合光照，完成
首先，計算mipmap LOD。這里可以采用三線性插值。
例如：
PSOut PS_Trilinear(PSIn input)
{
PSOut output;
float2 dx = ddx( input.texCoord * g_TextureSize.x );
float2 dy = ddy( input.texCoord * g_TextureSize.y );
float d = max( sqrt( dot( dx.x, dx.x ) + dot( dx.y, dx.y ) ) , sqrt( dot( dy.x, dy.x ) +
dot( dy.y, dy.y ) ) );
// 計算出
float mipLevel = log2( d );
float blendGlobal = saturate(g_StackDepth - mipLevel);
float4 color0 = PyramidTexture.Sample( samplerLinear, input.texCoord );
If (blendGlobal)//如果使用了全局clipmap pyrimad，及早退出
{
output.color = color0;
}
Else
{//使用了clipmap stack 貼圖，計算貼圖坐標，然后動態分支判斷應該采樣第幾層
貼圖
// This fractional part defines the factor used for blending
// between two neighbour stack layers
float blendLayers = modf(mipLevel, mipLevel);
blendLayers = saturate(blendLayers);
int nextMipLevel = mipLevel + 1;
nextMipLevel = clamp( nextMipLevel, 0, g_StackDepth - 1 );
mipLevel = clamp( mipLevel, 0, g_StackDepth - 1 );
// Here we need to perform proper scaling for input texture coordinates.
// For each layer we multiply input coordinates by g_ScaleFactor / pow( 2,
layer ).
// We add 0.5 to result, because our stack center with coordinates (0.5, 0.5)
// starts from corner with coordinates (0, 0) of the original image.
float2 clipTexCoord = input.texCoord / pow( 2, mipLevel );
clipTexCoord *= g_ScaleFactor;
//只是簡單的雙線性采樣
if (mipLevel==0)
{
//use clipStackTexture0.Sample(...)
}
If (mipLevel ==1)
{
//use clipStackTexture1.Sample(...)
}
}
Return output;
}
3-
4，
D3D10 的實現【
7】
D3D10 引入了一種叫Texture Array 的功能。可以在pixel shader 中直接利用一個整
數下標來尋找所需要的貼圖，然后進行采樣。思路同上，只不過不用動態分支，直接進行數
組索引后采樣。

圖片來源：NVSDK
圖中綠色部分就是texture array。
四，一些優化和擴展
Clipmap 在顯存中的存在，只是應對某一個固定攝像機位置和角度的場景貼圖需求。當
攝像機移動時，必須對clipmap 貼圖進行更新。具體更新方法第三章已經提過。但是，在攝
像機每一針運動都使用磁盤IO 和阻塞渲染管道的內存搬運，是不具實用性的。所以在實用
中，必須對clipmap 動態更新進行高度優化。這也是此技術的核心所在。
同時，對clipmap 的一些擴展是為了增強游戲的表現力。以下4-6 到4-9 的擴展方面沒
有進行任何實際論文和實例支持，只是一種對現有技術擴充的預想和估計。希望專家給與更
深入的建議。
4-1
，動態
clipmap
管理
Clipmap 的動態管理，必須滿足幾個條件。1，攝像機移動時的平滑實時渲染；2，不能
對攝像機的移動速度和位置有所限制；3，動態裝載更新應該是外部不可見，自動進行的。
4-2
，
2
級
cache
由一般異步動態裝載卸載應用技術得知，在大數據量進行從磁盤到內存的交換時，必須
有足夠的緩沖。由于磁盤到內存，內存到顯存的帶寬大不一樣，磁盤到內存比內存到顯存慢
得比較多。所以，對于從硬盤到顯卡內存的緩沖，需要存在至少2 步CACHE。
第一步，從磁盤到主內存的緩沖。對clipmap stack 貼圖周邊的圖素，必須預先讀入一些
到主存CACHE 中來。并且這個動作應該在整個游戲期間保持不停頓。預先讀入的數據根據
玩家移動方向做一定預測。
在模擬星球表面的海量貼圖庫中進行更新，同時還要考慮不同磁盤陣列相應速度等等。
所以磁盤到主存的緩沖策略非常重要。
第二步，從主存裝入內存，每次更新每個clipmap stack 貼圖周邊的半圈貼圖內容。

圖片來源：<The Clipmap: A Virtual Mipmap>
棕色區域是每次更新的內容。
4-3
，
多線程
IO
控制
在主循環中對貼圖進行磁盤IO，解壓，然后寫入clipmap stack 貼圖緩存，會同時阻礙
CPU 和GPU 的工作流水線。使得處理器停滯，影響效率。所以，對磁盤到主存的讀取IO，
解壓工作，可以放在另外一個線程中進行。寫入貼圖顯存的工作由于本身會阻斷D3D9 級別
顯卡的流水線。但是，可以利用一些策略延緩一次性裝入所有CLIPMAP STACK 貼圖的并
發。這將在4-6 講解。
4－1 中提到的攝像機平滑移動渲染，主要是指對clipmap stack 貼圖更新的步驟一定要
短，不能極大幅度影響主渲染循環的執行。在固定帶寬內，對clipmap stack 貼圖邊帶更新的
數據量并不很大。基本可以保持一個平滑渲染的過程。
在WINDOWS 系統，使用無緩沖的異步IO 模式是最適合此應用的。且文件以硬盤簇大
小的整數倍放置，讀取效率最快。
4-4
，
使用
MaxTextureLOD
在4－1 中提到，攝像機以任意速度移動，都不能影響渲染的平滑。我們采用如下策略。
1，當攝像機以設計速度移動時，clipmap 正常更新。
2，當攝像機超過設計速度，clipmap 更新速度無法趕上攝像機移動速度。則自動調整
max texture LOD。Max texture LOD 的意義是clipmap 工作在最高clipmap stack 的貼圖層數。
這個參數同時影響clipmap upload 和渲染pixel shader 中stack 選取。降低最高細節stack 意
味著降低climap update 的負荷。
3 當出現極端情況時，所有clip stack 更新都趕不上camera 移動，則只使用clipmap
pyramid 貼圖進行渲染。雖然圖象貼圖分辨率急劇下降，但是保證了camera 以任意速度漫游。
4-5
，對地形幾何渲染擴展
--geometry
clipmap
參考GPU GEMS2 的geometry clipmap 介紹文章【6】。簡單描述為：使用clipmap 進行
頂點生成。把高度圖做為clipmap 進行更新，然后做為vertex texture 的源。用以生成地形網
格。這么做的好處是，地形網格削減被放入了climap 的LOD 過程中。而不用CPU 做任何
額外計算工作。并且支持相對無限大地形。動態地形改變。
4-6
，
double
clipmap
buffer
，無效邊帶
4-3 指出，使用多線程把磁盤IO 和解壓縮，可以促進CPU 和GUP 協同工作。在對磁
盤文件進行預讀取時有著極大好處。在對JPEG 進行分塊讀取和REALTIME 解壓縮時，可
以在多核系統上獲得額外的負載減輕。
Clipmap 原先的設計，存在一個叫無效邊帶的技術。它可以使得SGI 硬件底層一邊渲染
一邊進行邊帶的貼圖更新。等于是主存到顯存的第0 級CACHE。PC 和有的CONSOLE 顯
卡不具備這樣的功能。對于寫入顯存操作，都是把一張貼圖顯存LOCK 住，進行寫入。在
這個期間此貼圖無法進行渲染。但是受此啟發，我們可以把CACHE 的粒度放為每層
CLIPMAP STACK 貼圖。結合多線程與DOULBE BUFFER 思想，方法如下：
1，在需要創建clipmap stack 貼圖時，對每層貼圖創建一個BACK BUFFER。
2，在渲染CLIPMAP 同時，多線程進行另外一組stack texture 的更新。雖然可以預知假
如寫入一張貼圖要阻斷整個GPU 工作管道的話，但是由于多線程把一組stack texture 按順
序更新。所以避免了在主循環并發一次性更新整個stack texture array。如果顯卡可以同時渲
染和寫入back buffer 的話，則效率應該會提高。
3，每針渲染完畢，調換STACK BACK BUFFER 到前臺。
這個方法DOULBE 了CLIPMAP 占用內存。但是在多核環境下，尤其顯卡支持渲染時
并發寫入貼圖顯存功能的話，CLIPMAP 更新效率會大大提高。內存的使用，前面進行過計
算，適合游戲的貼圖，采用1024 大小的DDS CLIPMAP，顯存占用不大。
4-7
，支持非
2
的
N
次方全局貼圖
在游戲中，一個全局的世界如果只能是2 的N 次方大小，會極大限制美術工作。如果
是正方形世界，貼圖只能是4G，16G，64G（都乘1.33)這個數量級別。考慮引入MxN 大小
的貼圖。M 和N 都不是2 的冪。
我們在之上取任意一點P，k<Px<M-k, k<Py<N-k， k=2^q(q=1,2,...),k 為接近分辨率的一
個2 的冪整數。圍繞P 建立一個邊長為k 的正方形。以k 正方形為基礎，創建clipmap。這
個clipmap 代表在P 點繪制需要的貼圖內容。
隨著攝像機移動，原先不用更新的clipmap pyramid 也需要根據ClipCenter 移動進行更
新。保持貼圖棱錐還是以2 的冪進行更新。換句話說，除了clipmap stack 貼圖更新，clipmap
pyramid 貼圖以及其mipmap 層，都需要更新。
這樣一來，我們就可以用clipmap 進行任意長寬世界貼圖的渲染。
4-8
，
支持法線貼圖進行象素級別光照
在ID TECH5 演示中，地表都具有凹凸貼圖象素光照。在這里無法給出確切的實現方法。
只是嘗試列出可能的實現方案。希望更進一步的探討。
法線貼圖同樣使用一張全局貼圖。
1， multipass 方法。使用第二張clipmap 裝載法線貼圖。
2，在更新diffuse color clipmap 時，利用3 張clipmap stack 貼圖的ALPHA 通道，
裝載法線貼圖的z,y,z。或者只裝載x,y（在pixel shader 計算z)。然后在pixel shader
重組，進行光照計算。2 層stack clipmap 代表一層normalmap。我們只在近距離使用
normalmap，遠處就用一個RGB(0.5,0.5,1)的藍色象素代替。在超出clipmap stack 視野區
域使用mipmap 的trilinear 插值。
3，使用clipmap 其中的一層或者兩層裝載法線貼圖，因為遠距離地形景物不需要象素
級別的光照。所以直接對近景進行象素光照即可。凹凸象素光照消失的地方使用一些三線性
插值，平滑過渡。
4-9
非地形應用
Clipmap 主要用于大規模地形渲染的貼圖調度。在此基礎上，對非地形場景的渲染，應
用clipmap 也稱為可能。Clipmap 實際是對貼圖數據庫進行了一種線性組織和查找。可以根
據簡單的x,y 坐標以及u.v 貼圖坐標定位所需要貼圖在clipmap texture database 的位置。地形
應用的天然方便之處在于，地形網格的空間位置本身就說明了其貼圖紋理在clipmap texture
database 中的位置。
根據此思想，如果能夠在場景中固定幾何物體信息中標致好所在clipmap 數據庫中的位
置。并且有效組織場景中的幾何體貼圖存放位置也和其世界空間位置相關。這樣就能在幾何
體與clipmap 之間建立起一種聯系。隨著攝像機的移動，clipmap 貼圖不斷更新，相應場景
中的物體就被賦上材質。當視角遠離物體，此物體貼圖不再被使用，從顯存中清除。這樣就
實現了非地形的海量幾何物體貼圖的clipmap 管理。
此思想只是停留在思考階段。需要在今后的工作中實踐。
五，是否值得
5-1
，地形渲染精度和容量
我們來計算一下實際游戲大概需要的貼圖容量。
假設地形，高度圖的一個象素代表一個格子。一個格子代表現實一米。屏幕分辨率
r=1024x1024。人眼離地面最低距離d=1 米。FOV=90。離地面最近距離為人眼直視下方。根
據透視關系，可以推算出在屏幕上2 米的格子將會撐滿整個屏幕。
一張非TILING 的貼圖，平鋪在地下，我們可以計算出，如果需要屏幕的一個象素恰好
被一個貼圖圖素覆蓋(mipmapLOD=0)。則需要2x2 的格子貼一張1024 非TILING 的貼圖。
對于一個格子貼512 象素才不會被filter 進行插值模糊。這個貼圖細節度是非常驚人的。
按這個計算，要一張全局RGB24BIT 貼圖貼滿1 平方公里的區域，就需要
1024*1024*512*512*3*1.33 字節＝ 1Tb 的RGB 貼圖。粗略估計JPEG 大概為40－50G 之間。
但是1T 的海量貼圖相當于一張1024x1024 圖的26 萬倍，這基本不太可能由美術手工完成。
而且，一公里的距離根本不足以表現大型世界。假設人站在512，512 的坐標，500 米的直
線距離，景物遠遠沒有達到人眼視界之外。人眼在晴天看遠處山脈可以有十幾公里的視界。
就算在遠處不用精細的貼圖，但是人既然能夠移動過去，那么必然要制作這么大范圍的全局
貼圖。利用512 象素代表一米顯然是不現實的。
如果我們認為不需要那么高的精度。觀察WOW，粗略估計可以接受的精度為，128-256
象素代表一米(WOW 基本為256）。我們計算人眼離地1 米時一個圖素覆蓋4 個象素插值的
情況：128*128*1024*1024*3*1.33 = 65G. JPEG 估計3G。4 平方公里就是48G。
對于付出如此巨大代價，在一平方公里之內，讓美術進行了相當于一萬六千多張
1024x1024 地圖的手繪，實時渲染進行非常復雜的CACHE 和多線程異步操作，得到的效果
只是4 個象素模糊一個圖素的圖形細節。而且如果游戲想承載4 平方公里的地域，基本就已
經超出目前CONSOLE 和PC 能夠接受一個游戲容量的范圍。即便是藍光，也快到達了極限。
而4 平方公里對次世代游戲來說，簡直是九牛一毛。有很多游戲（CRYSIS）對于表現幾十
平方公里都已經非常得心應手。數量也在幾個G 之內。所以單純使用clipmap 實現連續大型
地形渲染，以目前硬件容量，還是比較吃力。需要其他優化手段配合。
接下來計算貼圖更新速度需求。假設人類行走1.5 米/秒.如果按照斜前方行走。1 米128
圖素。Clipmap 為1024。Clipmap stack 為6 層。在一秒人類行走經過的地域，以1024 為邊
界，正方形邊帶圖素個數大約為1.5/sqrt(2) *128* 1024 * 2 ＝ 2172Kb。1 秒鐘需要更新的
圖素內存為6x2172x3 = 39096Kb 。大約40MB。假設30Hz 刷新，一針里更新的數據為
39096/30 = 1.3Mb。一針一MB 的數據流量，也是非常客觀。
5-2
，對傳統地形渲染方法進行
STREAMING
5-1 節對使用全局貼圖進行大范圍渲染的數量和最小貼圖傳輸量做了估計。接下來我們
看一下，應用clipmap 思想，傳統地形渲染方法是否有可擴展的空間。
在1-2-1 和1-2-2 使用tiling 的兩種地形渲染方法中，都提到要應用至少1－2 張全局地
表紋理貼圖。在使用全局貼圖繪制過程中，完全可以借鑒clipmap 的技術。把全局alpha 和
lightmap，或者全局diffuse 顏色圖放入clipmap 管理。由于其他圖層都是靠tiling 實現。理
論上可以實現貼圖密度無限制，貼圖大小無限制的全面解決方案。而制作全局diffuse 顏色
圖和制作clipmap 全局圖一樣。Alpha map 靠手工繪制。Lightmap 可以自動生成。并不會比
只使用一張全局地形貼圖麻煩多少。
六，結論
Clipmap 極大的釋放了顯存限制，把應用對貼圖細節的無限增長需求轉化為對clipmap
實時更新的技術解決方案。此應用不僅可以用于大規模地形渲染，也可以應用與大型場景中
固定幾何物體的貼圖管理。
Clipmap 可以做為一種空間和貼圖數據庫的對應管理系統。并且在象素級別進行LOD。
結合geometry clipmap 的應用，可以相對提高虛擬現實制作的生產力。
同時Clipmap 的更新成為了一個新的瓶頸。在PC 硬件架構上，需要極大精力進行更新
的優化。
另外，在對次世代游戲質量和渲染精度的標準下，對clipmap 采用全局世界紋理的可行
性做了分析，并提出了質疑。同時結合傳統地形渲染方法，給出了與clipmap 相結合的可能
性。
來信請給puzzy4d@yahoo.com.cn，歡迎討論。
索引
【1】WORLD OF WOLFCRAFT,http://www.wowchina.com, Blizzard,2004
【2】Far Cry, http://www.crytek.com/, Crytek,2007
【3】<The Clipmap: A Virtual Mipmap>,Christopher C. Tanner, Christopher J. Migdal, and Michael
T. Jones,Silicon Graphics Computer Systems,1998
【4】EWINS Jp，WALLER MD，WHITE M，et a1．MIP—Map Level Selection for Texture
Mapping[J]．IEEE TRANSACTIONS ON VISUAIAZATION AND COMPUTE R GRAPHICS，
1998，4(4)
【5】Mipmap 映射技術中d 值計算方法的探討,韓慧健，徐振中，張誠潔,計算機應用,第
24 卷第12 期,2004
【6 】Terrain Rendering Using GPU-Based Geometry Clipmaps,<GPU GEMS 2>,
Hoope,NVIDIA,2005
【7】NVIDIA, SDK10,clipmaps

http://wenku.baidu.com/view/d20b147e5acfa1c7aa00cc42.html

posted @ 2013-02-23 23:19 麒麟子閱讀(1457) | 評論 (0) | 編輯收藏

僅列出標題

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

麒麟子

導航

統計

常用鏈接

留言簿(12)

隨筆分類

隨筆檔案

Friends

WebSites

積分與排名

最新隨筆

最新評論

閱讀排行榜

評論排行榜

Directional Light Map(Directional Irradiance)

irrlicht引擎：硬件蒙皮骨骼動畫

irrlicht引擎：實現天龍八部的RPG角色換裝

請教大家一個關于EPOLLET和EPOLLLT的問題

ID Tech 5 中"Megatexture"針對地形的D3D9 基本實現原理