国产综合第一页,欧美高清视频一二三区,久久精品一区

战魂��筑 — Wed, 26 May 2010 09:01:00 GMT

今天��利昄��静态模�? 加上�U�理�?发现ZBuffer好像有点不对�?/p>

于是��查D3DRS_ZENABLE,D3DRS_ZWRITEENABLE, �l�果都是TRUE

无奈,只有与我以前正确的Demo�Ҏ(gu��)��210个渲染状�? 有部分渲染不同的,使用��代码强行纠�?�l�果: 无效

怀疑顶�Ҏ(gu��)��式破�? 重新使用以前的模型格�?排除�q�个可能�? �l�果:��p�|

无奈�?��查设备选项, �H�然注意到D3DPRESENT_PARAMETERS �l�构体中的EnableAutoDepthStencil 讄��是FALSE

因�ؓ(f��)�q�次讑֤��c�L��重写�?�Ҏ(gu��)��以前正确代码, 有差�?��其改�ؓ(f��)

PresentParameters.EnableAutoDepthStencil = TRUE;
PresentParameters.AutoDepthStencilFormat = D3DFMT_D16;

以前��阅SDK�?注意�q�这个选项, �q�是由D3D帮你��理ZBuffer.

��试, 问题解决.

分析: 如果EnableAutoDepthStencil = FALSE, 意味着�q�ZBuffer都没�?那更不要说渲染状�?

正确�l�果

战魂��筑 2010-05-26 17:01 发表评论

DirectX 9.0 Direct3D 囑�Ş��线大图

战魂��筑 — Wed, 26 May 2010 03:35:00 GMT

战魂��筑 2010-05-26 11:35 发表评论

战魂��筑 — Wed, 26 May 2010 03:19:00 GMT

转蝲��h��? 战魂��筑

本文��译整理�ȝ��?a >http://http.developer.nvidia.com/GPUGems2/gpugems2_chapter05.html

如果喜欢,误��买正�?/p>

多流技术在渲染时能�Ҏ(gu��)��能和结构有一定好�?但是怎样��模型数据分配到各顶�Ҏ(gu��)��据流�q�行渲染��是一个学�?

对于��点数据可以分�ؓ(f��)�q�么几个大类:

G: 多边形数�? 包含vertex position, normal, and vertex color(s).

T: �U�理映射, 包含多层�U�理坐标及tangent vectors�{?/p>

A: 动画数据, 骨骼动画中的骨骼权重及骨骼烦�?/p>

I: 用于Instance�l�制的用��h��?/p>

以下是对一些常用渲染的��搭�?

静态模�?/p>

可以�? G or G + T

骨骼动画模型

可以�?G + A or G + T + A

Instance�l�制的骨骼动��L��?/p>

可以�?G + I or G + T + I 或者动�ȝ��型的G + A + I or G + T + A + I

渲染Z-Pass物�g

可以�?strong>G, 或者动�ȝ��型的G + A or G + I or G + A + I

战魂��筑 2010-05-26 11:19 发表评论

战魂��筑 — Fri, 14 May 2010 04:01:00 GMT

CEGUI的字�W�串�c�设计的初衷是以32个字�W��ؓ(f��)分界�? 低于32个字�W��用固定buffer, 高于才��用栈分配内存存储字符�? 不过因�ؓ(f��)CEGUI使用utf32,兼容性虽然很�?但是在VC调试器里无法昄��是个很大的问�?

�q�里参考了mybios博客中的文章,�l�CEGUI字符串做一个patch

然后需要找到vs2008的autoexp.dat文�g

XP下位�?C:\Program Files\Microsoft Visual Studio 9.0\Common7\Packages\Debugger\autoexp.dat

用记事本�{�工��h��开, 在AutoExpand�D�中像这��h��?

[AutoExpand]
; CEGUI String
CEGUI::String = str = length =

卛_��在VC调试器中看到CEGUI字符串内�? 不过中文�q�是暂时无法支持

战魂��筑 2010-05-14 12:01 发表评论

战魂��筑 — Tue, 11 May 2010 02:21:00 GMT

要在游戏中用到强大而有扩展性的骨骼动画,有很多注意点.

首先,我们得弃用CPU蒙皮, 虽然兼容性好,但是面对��C��多核但�ƈ不提高单栔R��率的情况下,GPU�q�是王道.而且GPU蒙皮代码可能更简�?不过也有一点小�~�点, 对于��引擎来�?Shader必须�l�静态模型和骨骼动画模型写两�?

其次我们需要加��Z��个SubSkin的骨骼支持数�? 骨骼动画上的每个SubSkin都是一�ơDraw, 但是按照传统骨骼动画�pȝ��,每个骨头对应一个矩阵传�?那么SM2.0保守计算只能支持50栚w��? 不过在我前段旉��?a href="http://www.shnenglu.com/sunicdavy/archive/2010/04/26/113578.html">文章中有提到�q�个技�?�q�且已经在我的骨骼动�ȝ��l�及OGRE中实�?效果很好.

��术也许很反感一个�h物做1个SubSkin, 他们更新好多个SubSkin,也就是说�w�体每个部分都是一个SubSkin, �q�样方便修改, 同时�pȝ��支持的骨骼数量还可以有一定量的上�?不过我们�q�需要做一个烦引工�? 传统的GPU骨骼动画中��L��在渲染SubSkin前传入所有这些SubSkin需要用到的骨骼矩阵. 但是每个SubSkin�q�不一定能用到所有的�q�些矩阵,�q�明显是一�U�浪�? 因此在OGRE中做�q�一�ơ烦引预处理,也就是将每个SubSkin用到的骨骼统计出�? 在渲染这�ơSubSkin时才重新传到GPU. 很明�?�q�是用速度�q�空间和兼容�? 如果在DX10以上,有ConstantBuffer�q�好. DX9实在太慢�?/p>

使用Marker点的换装�pȝ��很难处理例如贴��n衣物�q�类物�g换装. OGRE中有一�U�共享骨骼的技�? 可以支持, 不过从代码分析看�?�q�种技术对CPU端骨��D��量实在是大的惊�? 因此我们军_��整个SubSkin(也就是SubEntity)换掉,�q�样��q��术根据不同换装类型来��衣服在MAX中直接绑定好后直接替换原始模型中的SubSkin卛_��辑ֈ�换装效果.可以说这是从动态计��到静态预处理的�{�?效率提升很多.

战魂��筑 2010-05-11 10:21 发表评论

战魂��筑 — Wed, 05 May 2010 09:07:00 GMT

首先参考SDK里这个函数的定义:

HRESULT DrawIndexedPrimitiveUP(

D3DPRIMITIVETYPE PrimitiveType,

UINT MinVertexIndex,

UINT NumVertices,

UINT PrimitiveCount,

CONST void * pIndexData,

D3DFORMAT IndexDataFormat,

CONST void* pVertexStreamZeroData,

UINT VertexStreamZeroStride

);

�q�里假设我们要绘制一个由2个三角�Ş�l�成的面,那么参数�q�样讄��

MinVertexIndex = 0;

NumVertices = 4;

PrimitiveCount = 2;

pIndexData = { 0,1, 2, 0, 2, 3}

IndexDataFormat = D3DFMT_INDEX16

pVertexStreamZeroData = { 4个角的位�|?}

VertexStreamZeroStride = { �l�构体的跨度 }

我们注意�? 没有��M��一个参数用于描�q?b>CONST void * pIndexData的size 大小.

但其实你的图元是可以正确�l�制�? 但是你�ƈ没有在indexdata后面加上例如字符�?的结��։�,那么D3D是怎么知道IndexCount�?

我们先看下怎么�Ҏ(gu��)��VertexCount�?PrimitveType��定 PrimitiveCount

PrimitveType	公式
D3DPT_POINTLIST	PrimitiveCount = VertexCount
D3DPT_LINELIST	PrimitiveCount = VertexCount/2
D3DPT_LINESTRIP	PrimitiveCount = VertexCount-1
D3DPT_TRIANGLELIST	PrimitiveCount = VertexCount/3
D3DPT_TRIANGLESTRIP	PrimitiveCount = VertexCount-2

�? D3DPT_TRIANGLEFAN在以后的驱动中已�l�不再��?因此不再采用

当��用烦引缓冲时, VertexCount = IndexCount

因此在上例中 PrimitiveCount = IndexCount/3

也就是说 IndexCount = PrimitiveCount * 3

代入PrimitiveCount = 2,因此 IndexCount = 6

因此�E�_��的API的函数参数设计是�l�不�?x��)浪费�Q何一个参数的

战魂��筑 2010-05-05 17:07 发表评论

战魂��筑 — Mon, 26 Apr 2010 05:31:00 GMT

传统的蒙皮骨骼动��L؜合方法易于理�?但是在SM 2.0�?56帔R��限制�?骨骼��C��守计��最�?0栚w��?因此对美术的工作��程以及模型渲染�Ҏ(gu��)��造成了很大的障碍

float4x4 matBoneArray[40]; //  �q�是传输的瓶�?/span>

VS_OUTPUT vs_main( SkinnedVS_INPUT In )

    VS_OUTPUT Out = (VS_OUTPUT)0;

    float4x4 skinTransform = 0;

    skinTransform += matBoneArray[In.BoneIndices.x] * In.BoneWeights.x;

    skinTransform += matBoneArray[In.BoneIndices.y] * In.BoneWeights.y;

    skinTransform += matBoneArray[In.BoneIndices.z] * In.BoneWeights.z;

    skinTransform += matBoneArray[In.BoneIndices.w] * In.BoneWeights.w;

    float4 localpos = mul(In.Position, skinTransform);

    Out.Position = mul( localpos, matViewProj );

    Out.TexCoord = In.TexCoord;

    return Out;

matBoneArray�q�个数组是骨骼的LocalRot和LocalTranslation 通过以下函数build出来

    Matrix4& Matrix4::FromTranslationRotation( const Vector3& translation, const Quaternion& rotation )

        float xx = rotation.x * rotation.x * 2.0f, yy = rotation.y * rotation.y * 2.0f, zz = rotation.z * rotation.z * 2.0f;

        float xy = rotation.x * rotation.y * 2.0f, zw = rotation.z * rotation.w * 2.0f, xz = rotation.x * rotation.z * 2.0f;

        float yw = rotation.y * rotation.w * 2.0f, yz = rotation.y * rotation.z * 2.0f, xw = rotation.x * rotation.w * 2.0f;

        m[0][0] = 1.0f - yy - zz; m[0][1] =        xy + zw; m[0][2] =        xz - yw; m[0][3] = 0.0f;

        m[1][0] =        xy - zw; m[1][1] = 1.0f - xx - zz; m[1][2] =        yz + xw; m[1][3] = 0.0f;

        m[2][0] =        xz + yw; m[2][1] =        yz - xw; m[2][2] = 1.0f - xx - yy; m[2][3] = 0.0f;

        m[3][0] =  translation.x; m[3][1] =  translation.y; m[3][2] =  translation.z; m[3][3] = 1.0f;

        return *this;

从这里你可以发现, 本来每根骨头只需�?个float4 传递变换信息的,现在却需�?个float4,也就是一个矩阉|��传�?矩阵中还有很多不使用的变量也被传输到GPU�?�q�里��是优化的点.

重新调整后的Shader代码:

float4x4 BuildFromTransRot( float4 translation, float4 rot )

    float4 rotation = rot;

    float xx = rotation.x * rotation.x * 2.0f, yy = rotation.y * rotation.y * 2.0f, zz = rotation.z * rotation.z * 2.0f;

    float xy = rotation.x * rotation.y * 2.0f, zw = rotation.z * rotation.w * 2.0f, xz = rotation.x * rotation.z * 2.0f;

    float yw = rotation.y * rotation.w * 2.0f, yz = rotation.y * rotation.z * 2.0f, xw = rotation.x * rotation.w * 2.0f;

    float4x4 m = {

    {1.0f - yy - zz,             xy + zw,             xz - yw,         0},

    {xy - zw,              1.0f - xx - zz,             yz + xw,         0},

    {xz + yw,                      yz - xw,     1.0f - xx - yy,         0},

    {translation.x,       translation.y,       translation.z,         1}

};

    return m;

float4x4 GetBoneElement( float index )

    return BuildFromTransRot( vecBoneLocalTrans[index], vecBoneLocalRot[index] );

VS_OUTPUT vs_main( SkinnedVS_INPUT In )

    VS_OUTPUT Out = (VS_OUTPUT)0;

    float4x4 skinTransform = 0;

    skinTransform += GetBoneElement(In.BoneIndices.x) * In.BoneWeights.x;

    skinTransform += GetBoneElement(In.BoneIndices.y) * In.BoneWeights.y;

    skinTransform += GetBoneElement(In.BoneIndices.z) * In.BoneWeights.z;

    skinTransform += GetBoneElement(In.BoneIndices.w) * In.BoneWeights.w;

    float4 localpos = mul(In.Position, skinTransform);

    Out.Position = mul( localpos, matViewProj );

    Out.TexCoord = In.TexCoord;

    return Out;

我们��骨头的local旋�{及偏�U�M��递至GPU,然后在GPU内重�l?虽然对GPU性能计算有部分损�?但是骨骼数量��p��保守提高�?00�?

战魂��筑 2010-04-26 13:31 发表评论

战魂��筑 — Thu, 15 Apr 2010 08:06:00 GMT

OGRE 中的3�U�层�ơ实现多�U�程渲染的文�?

http://isdlibrary.intel-dispatch.com/vc/1632/Threading_OGRE3D.pdf

ATI有关多线�E�效率提升的游戏比较及一些tips

http://developer.amd.com/assets/ATIMThread.pdf

战魂��筑 2010-04-15 16:06 发表评论

游戏工程里的使用C++静态库与动态库

战魂��筑 — Wed, 07 Apr 2010 08:08:00 GMT

假设我们�?个工�E�及其工�E�类型：(x��)

CORE DLL

ENGINE DLL

GAME EXE

D3DRENDER DLL

其中D3DRENDER是GAME动态蝲入的�Q�其需要链接CORE,ENGINE

�q�是一个很常见的模式，但是不好的是�Q�因为CORE和ENGINE均是DLL�Q�代码中的Symbol都被导出才可使用。�Q何�h使用DEPENDENCE工具��可以将DLL中引用的东西查看的清楚，虽然�q�不至于造成技术泄漏，但从速度和DLL大小来说都是不划��的�?/p>

现在很多游戏主exe一般都�?0M+甚至20M+的大exe�Q�这都是使用静态链接而成。但是对代码�l�构也必��d��Z��定的调整。所有工�E�必��都是静态库�Q�这��h��能保证像CORE�q�样的静态库中的全局/静态变量不至于被链�?份而造成内存�D�逻辑错误�?/p>

当然�Q��用全静态库�q�需要注意一点：(x��)所有的lib都是在最后的game工程里来做链接�?/p>

战魂��筑 2010-04-07 16:08 发表评论

战魂��筑 — Wed, 07 Apr 2010 02:36:00 GMT

转蝲�?独立游戏中文论坛

UDK是unrealengine develpoment kit 的羃写，��单来说就是大名鼎鼎的虚��Q�引擎的免费商业版本�Q�不�q�虚�q�３毕竟�q�是�Q�年前的dx9的入门��引擎�Q�在商业上取�?br>巨大成功�Q�技术上也显得落后．目前Epic��x��q�虚�q�３的最后一�Ҏ(gu��)��力，于是�q�脆发布了这个免费版本．��M��人都可以用Ｕ�Q��O开发游戏，但是如果游戏牟利的话每年�q�是要向
Epic交纳一定数量的技术授权费用的�Q�先不管�q�个�Q�还是来看看它的官方视频教程吧．
　　[attach]44[/attach]
链接如下�Q�　　
http://udn.epicgames.com/Three/VideoTutorials.html
一共５个教�E�　从引擎配�|�介�l�开始，到关卡和人物�~�辑器，以及最后一个完整的��游戏的制作�Q�对于入门来说完全��够了�Q?br>视频说的�q�比较详�l�，听力不好的同学可以对照下开发文档　http://www.udk.com/documentation　里面基本说的很详�l�．
最后附上Ｕ�Q��O的下载地址�Q�　March 2010 UDK Beta (548 MB .exe)　
好了�Q�Ｕ�Q��O对于初学者来说还是比较适合的．对于游戏的开发�h员来说引擎的整体架构�q�是很值得学习(f��n)的．希望你学的愉快．

战魂��筑 2010-04-07 10:36 发表评论

模拟OGRE的Compositor

战魂��筑 — Thu, 01 Apr 2010 10:56:00 GMT

RenderTarget完成后，开始模拟OGRE的Compositor�?/p>

OGRE的Compositor其实��是用于解决�l�制PostEffect的，��单的��_(d��)��是一�U�RenderTarget的流�E�控制脚�?/p>

�q�是OGRE compositor文�g的片�D?/p>

compositor Bloom

    technique

        // Temporary textures

        texture rt_output target_width target_height PF_R8G8B8

        texture rt0 target_width_scaled 0.25 target_height_scaled 0.25 PF_R8G8B8

        texture rt1 target_width_scaled 0.25 target_height_scaled 0.25 PF_R8G8B8

        target rt_output

            // Render output from previous compositor (or original scene)

            input previous

        target rt0

            // Start with clear texture

            input none

            // Horizontal blur pass

            pass render_quad

                // Renders a fullscreen quad with a material

                material Ogre/Compositor/BrightPass2

                input 0 rt_output

        target rt1

            // Start with clear texture

            input none

            // Horizontal blur pass

            pass render_quad

                // Renders a fullscreen quad with a material

                material Ogre/Compositor/BlurV

                input 0 rt0

        target rt0

            // Start with clear texture

            input none

            // Horizontal blur pass

            pass render_quad

                // Renders a fullscreen quad with a material

                material Ogre/Compositor/BlurH

                input 0 rt1

        target_output

            // Start with clear output

            input none

            // Draw a fullscreen quad

            pass render_quad

                // Renders a fullscreen quad with a material

                material Ogre/Compositor/BloomBlend2

                input 0 rt_output

                input 1 rt0

大概我们知道�Q�一个Compositor分�ؓ(f��)资源定义与绘制步骤（target xxx�Q?/p>

而一个绘制步骤又分别定义�Q?/p>

1. �Q�输入）�l�制的是什么东西？

2. �Q�效果）�l�制成什么样子？

3. �Q�输出）往哪里�l�制�Q?/p>

输出方式在这个例子有2�U�：(x��)�U�理�Q�RT�Q�和屏幕

输入方式�?中：(x��)�U�理及场�?/p>

我们可以使用一个回调来对一个绘制步骤提供绘制输�?/p>

�l�制效果��是一大堆的Shader�Q�这些shader都是��Z��一个quad来做的，也就是一个矩形，使用变换后的��点和一个纹理坐标作为顶点定�?/p>

不过�q�里是不需要做vertexshader的，仅仅ps��矣�?/p>

�l�制的最后，是将前面�l�制的RT�Q�纹理）混合��h��

当然�Q�如果步骤比较多和复杂时�Q�RT之间跟寄存器一��P��可以反复使用

昄��茶壶法线的场景加�?Blur 的PostEffect

xml version="1.0" encoding="gb2312" ?>

<Compositor name = "bloom" >

  <Resource>

    <RenderTarget name ="rt_source" size="screenquad" />

    <RenderTarget name ="rt0" size="screenquad" />

    <RenderTarget name ="rt1" size="screenquad" />

  Resource>

  <Step target="rt_source">

    <Geometry type ="callback" callback = "rt_input"/>

  Step>

  <Step target="rt0">

    <Geometry type = "screenquad"/>

    <Effect name ="material\blurH.xml">

      <Texture name ="mTexture" value ="rt_source" />

    Effect>

  Step>

  <Step target="rt1">

    <Geometry type = "screenquad"/>

    <Effect name ="material\blurV.xml">

      <Texture name ="mTexture" value ="rt_source" />

    Effect>

  Step>

  <Step>

    <Geometry type = "screenquad"/>

    <Effect name ="material\combine.xml">

      <Texture name ="mTexture1" value ="rt0" />

      <Texture name ="mTexture2" value ="rt1" />

    Effect>

  Step>

Compositor>

�q�是我的引擎里的Compositor脚本�Q�还在慢慢加强功能，希望能有一天达到OGRE的Compositor功能

战魂��筑 2010-04-01 18:56 发表评论

3D引擎设计�Q�支持多RenderTarget及多Viewport

战魂��筑 — Mon, 29 Mar 2010 10:16:00 GMT

如果让你的引擎结构支持多个RenderTarget�l�制及多个Viewport�Q�这里是我的��单设计：(x��)

同样适用我的文本设计图标�?+为包�? <为派�?

RenderTexture

RenderTarget

+RenderView (对于一个RT�Q�可以是屏幕�Q�可以是�U�理RT�Q�所以可以拥�?1~n个切分视�?)

+Camera

+Viewport

以下是多View�l�制的类XNA伪代�?/p>

Engine.Run()

    Device.Clear()

    // 保存当前全屏Viewport

    ScreenViewport = Device.CurrentViewport

    Device.BeginScene()

    // 遍历当前屏幕RT下的所有View

    foreach RenderView in ScreenRT

        // 未激�zȝ��View不用�l�制

        if RenderView not active then continue

        // ���View对应的Viewport提交到设�?

        RenderView.CommitViewport()

        // 渲染回调

        foreach RenderEventListener in RenderEventListenerList

            RenderEventListener.OnRenderFrame()

    Device.EndScene()

     Device.Present()

    Device.CurrentViewport = ScreenViewport // 恢复全屏viewport

以下是RT间嵌套绘制的伪代码：(x��)

RenderView.SwitchRenderTarget(stage, RenderTarget)

    // 保存�l�制前的RT

    PreTarget = Device.GetRenderTarget()

    // 讄���为当前的RT

    Device.SetRenderTarget( RenderTarget )

    // 更新RT摄像�?/span>

    RenderTarget.UpdateCamera()

    // 清空RT

    Device.Clear()

    // �l�制回调

    RenderTarget.OnRender( )

    // 恢复之前的RT

    Device.SetRenderTarget( PreTarget  );

战魂��筑 2010-03-29 18:16 发表评论

战魂��筑 — Wed, 17 Mar 2010 03:08:00 GMT

完成自己的shader�pȝ��后，��d��之前写过的代码中发现有一个地方很奇�?/p>

我的矩阵定义跟OGRE的没什么区�?/p>

        union

            struct

                float m11, m12, m13, m14;

                float m21, m22, m23, m24;

                float m31, m32, m33, m34;

                float m41, m42, m43, m44;

};

            float m[4][4];

};

乘法也跟OGRE的一模一��P��但在��view及project乘好的矩阵送给HLSL�Ӟ��却必��{�|�下�Q�才能得到正��的�l�果

mSkinnedEffect.mMatrix.mValue = (camera.mViewMatrix * camera.mProjectMatrix).Transpose();

shader:

float4 localpos = mul(In.Position, skinTransform);

OGRE中有�q�么一�D�代码及注释:

    const Matrix4& AutoParamDataSource::getProjectionMatrix(void) const

        if (mProjMatrixDirty)

            // NB use API-independent projection matrix since GPU programs

            // bypass the API-specific handedness and use right-handed coords

            if (mCurrentRenderable && mCurrentRenderable->getUseIdentityProjection())

                // Use identity projection matrix, still need to take RS depth into account.

                RenderSystem* rs = Root::getSingleton().getRenderSystem();

                rs->_convertProjectionMatrix(Matrix4::IDENTITY, mProjectionMatrix, true);

            else

                mProjectionMatrix = mCurrentCamera->getProjectionMatrixWithRSDepth();

            if (mCurrentRenderTarget && mCurrentRenderTarget->requiresTextureFlipping())

                // Because we're not using setProjectionMatrix, this needs to be done here

                // Invert transformed y

                mProjectionMatrix[1][0] = -mProjectionMatrix[1][0];

                mProjectionMatrix[1][1] = -mProjectionMatrix[1][1];

                mProjectionMatrix[1][2] = -mProjectionMatrix[1][2];

                mProjectionMatrix[1][3] = -mProjectionMatrix[1][3];

            mProjMatrixDirty = false;

        return mProjectionMatrix;

貌似是跟左右手这个恶心的东西有关�p?/p>

回看DirectXSDK中提供的BasicHLSL例子

        mWorld = g_mCenterWorld * *g_Camera.GetWorldMatrix();

        mProj = *g_Camera.GetProjMatrix();

        mView = *g_Camera.GetViewMatrix();

        mWorldViewProjection = mWorld * mView * mProj;

        V( g_pEffect->SetMatrix( "g_mWorldViewProjection", &mWorldViewProjection ) );

shader�Q?/p>

Output.Position = mul(vAnimatedPos, g_mWorldViewProjection);

丝毫无需转置矩阵,Effect接口中也提供有SetMatrixTranspose�q�类�Ҏ(gu��)��。所以排除内部有自动转置的嫌疑�?/p>

询问�q�野猪这个问题，野猪�{�曰:"转置后传输至需要传3个vector, 最后一个是[0 0 0 1]�?

有达人知道的�Q�可以指点下�q�h�| :)

战魂��筑 2010-03-17 11:08 发表评论

战魂��筑 — Fri, 12 Mar 2010 08:13:00 GMT

本�h的设计图可以方便在文本编辑器里查�?>为派�?+为包�?

MAX插�g导出的模型资源分�Q�Mesh/Skin, Skeleton, Animation

不同动作按照不同的动��L��件保�?

ResourceHandle 包含基本id
        >NamedResourceHandle 带有名称资源�Q�包含hashA, hashB�Q?使用暴雪hash函数生成
        >ModelHandle
        >MeshHandle
        >SkeletonHandle
        >AnimationHandle

获取资源�Q�如果资源不存在�Ӟ��自动加蝲
ModelMaster.ManualCache( &ModelHandle )

直接资源讉K��Q?br>RawSkeleton = ModelMaster.ManualCache( &SkeletonHandle("a.skl") )
RawSkeleton->GetMarker(...)

异步资源加蝲�Q�异步id保存于ModelHandle中，在callback中根据id��认
ModelMaster.AsyncCache( &ModelHandle )

获取资源指针�Q�未加蝲�Ӟ��q�回�I?br>ModelResource = ModelMaster.Fetch( &ModelHandle )

模型资源加蝲�?br>    在模型句柄中�l�定对应加蝲�?br>    可以自行�~�写带换装的ModelLoader�Q�通过��d��自己的配�|�文�Ӟ��自行加蝲资源后生成RawModel
ModelLoader
    ModelHandle         ---mapping--->    ModelLoader         ---generate--> RawModel
    MeshHandle          ---mapping--->    MeshLoader             ---generate--> RawMesh
    SkeletonHandle     ---mapping--->    SkeletonLoader      ---generate--> RawSkeleton
    AnimationHandle    ---mapping--->    AnimationLoader   ---generate--> RawAnimation

引用计数�c?nbsp;
ModelResource
    >RawModel
    >RawMesh
    >RawSkeleton
    >RawAnimation

RawModel中不保留Handle�Q�只保留指针
RawModel
    +MeshVB    从模型文件中直接��d��点格式�Q�包�?静�?GPU,CPU�c�d��点
        +RawMesh
        +MeshIB        一�ơ性填充IB
        >GPUMeshVB    一�ơ性填充VB
        >CPUMeshVB    每��计算
    +Animation            �q�行期数据（旉��/帧）
        +RawAnimation    原始动画内容
    +Skeleton
        +RawSkeleton

战魂��筑 2010-03-12 16:13 发表评论

战魂��筑 — Fri, 05 Mar 2010 06:26:00 GMT

Direct3D中的Shader是这��L(f��ng)��Q?/p>

1. ASM Shader是最元老的也是DX8主要使用Shader

2. fxc�~�译器可以同时编译ASM,HLSL和fx脚本,其中HLSL和fx可以查看�~�译后的GPU汇编代码

3. D3D9中，fx是HLSL的一�U�渲染脚本，��化了HLSL讄��及常量绑定，�q�且附带RenderStateBlock及设�|?/p>

但只能用于制作简单的Shader

4. DirectXSDK中有一个概忉|؜淆：(x��)C++例子中的BasicHLSL使用的其实还是fx�Q�HLSLwithoutEffects例子才是真正的纯HLSL

5.fx与HLSL�E�序鉴别�Q?/p>

使用fx�E�序必定含有�Q�D3DXCreateEffectXXX �p�d��函数�Q?ID3DXEffect对象�Q�渲染中能看到SetTechnique�Q�BeginPass�Q�EndPass之类的字�?/p>

使用�U�HLSL�E�序含有�Q�D3DXCompileShader�Q�ID3DXConstantTable对象�Q�GetConstantByName�Q�GetConstantDesc之类的字�?/p>

6. 在fx中包含有 VertexShader�Q�PixelShader代码及profile�Q�entry�Q�RenderState讄��及简单的�l�制�q�程(pass)。一�ơ编译后�Q�VS,PS,Texture,Sampler及常量都是在ID3DXEffect对象中自动完成，无需手动讄��?/p>

7. HLSL可以��VS及PS代码写入1�?hlsl文�g。注意，以下�q�种代码可以在HLSL中编译过�Q�但实际没有��M��效果

   1:  sampler_state

   2:  {

   3:      Texture = ;

   4:      MipFilter = LINEAR;

   5:      MinFilter = LINEAR;

   6:      MagFilter = LINEAR;

   7:  };

�q�点可以参考AMD RenderMonkey中只在shader中��用sampler而忽略texture�?/p>

8. fx中往shader讄��U�理使用的是ID3DXBaseEffect::SetTexture下的�q�个函数

   1:  HRESULT SetTexture(

   2:    D3DXHANDLE hParameter,

   3:    LPDIRECT3DBASETEXTURE9 pTexture

   4:  );

但是在HLSL中，�q�点��变得很�ȝ��Q�需要手动设�|�，可以参考这��?a href="http://www.shnenglu.com/liangairan/articles/57971.html">文章

Shader代码片段�Q?/p>

   1:  sampler Samp0 = sampler_state

   2:  {

   3:      Texture = ;

   4:      MipFilter = LINEAR;

   5:      MinFilter = LINEAR;

   6:      MagFilter = LINEAR;

   7:  };

�~�译HLSL代码后得到ConstantTable�Q�然后取出句柄：(x��)

   1:  ScalarHandle = pixelConstTable->GetConstantByName(0, "Scalar");

2:

   3:  Samp0Handle = pixelConstTable->GetConstantByName(0, "Samp0");

4:

   5:  Samp1Handle = pixelConstTable->GetConstantByName(0, "Samp1");

再从句柄取出symbol的描�q�ͼ�(x��)

   1:  UINT count;

2:

   3:  pixelConstTable->GetConstantDesc(Samp0Handle, & Samp0Desc, &count);

4:

   5:  pixelConstTable->GetConstantDesc(Samp1Handle, & Samp1Desc, &count);

通过上面的描�q�ͼ��纹理变量的寄存器偏�U�M��为纹理的stage

8. 优化帔R��讄��速度的方法一般就是根据字�W�串取出句柄�Q�以后每�ơ渲染时�Q�只通过句柄讄��。但ID3DXConstantTable最后还是通过

IDirect3DDevice9::SetPixelShaderConstantX �p�d��函数来实现的

   1:  HRESULT SetPixelShaderConstantF(

   2:    UINT StartRegister,

   3:    CONST float * pConstantData,

   4:    UINT Vector4fCount

   5:  );

9. HLSL��一�D�包含VS和PS代码�~�译完成后，��得到VS和PS两个单独的ID3DXConstantTable

战魂��筑 2010-03-05 14:26 发表评论

枚�D反射对象和结构体反射填充

战魂��筑 — Fri, 26 Feb 2010 09:58:00 GMT

最�q�在写D3D9模拟D3D10接口的渲染系�l�中��到大量的渲染状态对象，不仅成员多，枚�D也多的要命�?/p>

    struct CORE_API RasterizerState : ResourceHandle            
    {
        eFillMode            mFillMode;        
        eCullMode            mCullMode;
        bool                mFrontFaceCCW;
        float                mDepthBias;
        float                mSlopeScaledDepthBias;
        bool                mDepthClipEnable;
        bool                mScissorEnable;
        bool                mMultisampleEnable;

        RasterizerState();
    };

而要从配�|�文件中��d��数据�q�填充到�q�个�l�构体，对于C++来说完全��是吃力不讨好的�Q�写出来的代码也是极��E�，修改和扩展极为麻烦的�?/p>

因此军_��使用反射的方法来填充数据�Q�先�ȝ��一下我的C++反射�pȝ��

class RTTIObject // 动态类型识别对象基�c�，对象通过一些宏后可以很方便的通过字符串创建出�c�d��例，�q�且可以查询注册时的�c�d��和其他绑定信�?/span>
class NameRef  // 名字表，�c�M��于虚�q�M��的FName�Q�可以定义Const和普通Name�Q�比较和拯���只是一个dword耗费的时�?/span>
value_parse�Q�value_tostring�Q�value_typename // 一�p�d���c�d��模板函数�Q�提供对�c�d��的ToString�Q�Parse及类型名查询

首先需要处理的是枚举查询，�q�里��枚��N��过宏做成一个个枚�D对象�Q��ƈ可以通过名字创徏实例

#define DECLARE_ENUMOBJECT( TEnum ) \
    struct EnumObject_##TEnum : EnumObject\
    {\
    DECLARE_RTTIOBJECT( EnumObject_##TEnum );\
    EnumObject_##TEnum( );\
    };


#define IMPLEMENT_ENUMOBJECT_BEGIN( TEnum, TEnum_prefixoffset, TMember_prefixoffset ) \
    IMPLEMENT_RTTIOBJECT_STRING( EnumObject_##TEnum, #TEnum + TEnum_prefixoffset, #TEnum + TEnum_prefixoffset, "EnumObject" )\
    EnumObject_##TEnum::EnumObject_##TEnum(){ const int member_prefixoffset = TMember_prefixoffset;

#define ENUMOBJECT_ADD( enumkey ) AddMember( #enumkey + member_prefixoffset, (dword)enumkey );

#define IMPLEMENT_ENUMOBJECT_END }

#define ENUMOBJECT_STATICINIT( TEnum ) EnumObject_##TEnum::StaticInit();

EnumObject 中通过宏将枚�D的名�U�和��g��存在�q�个对象�?/p>

IMPLEMENT_ENUMOBJECT_BEGIN( eFillMode, 1, 3 )  // �q�里�?�Q?是将eFillMode及FM_Point转成字符串后��L��前缀
    ENUMOBJECT_ADD( FM_Point )
    ENUMOBJECT_ADD( FM_Line )
    ENUMOBJECT_ADD( FM_Fill )
IMPLEMENT_ENUMOBJECT_END

// 注册到RTTIObject�pȝ��

ENUMOBJECT_STATICINIT( eFillMode )
// 通过枚�D对象可以查找到字�W�串对应的�?/span>
dword v;
EnumObject::GetEnumValue( "FillMode", "Point", v )

下一步是��结构体成员信息记录

    void SettingObject::BindMember( const NameRef& objname, void* instancePtr, void* dataPtr, SettingProxy* proxy )
    {
        proxy->mOffset = dword(dataPtr) - dword(instancePtr);

        MemberList& memberlist = mSettingMap[ objname ];
        memberlist[ proxy->mName ] = proxy;
    }

�q�里记录的是�l�构体成员的内存偏移

使用大量的宏�Q�可以让�l�构体绑定变得漂�?/p>

#define BIND_SETTINGOBJECT_BEGIN( TClass ) \
    { const NameRef& soname = TClass::StaticGetClassInfo()->mClassName;TClass soobj;

#define BIND_SO_MEMBER( TMemberType, TMember ) \
    so.BindMember( soname, &soobj, &soobj.TMember, new TSettingElement(#TMember + 1 ) );

#define BIND_SO_MEMBER_NAME( TMemberType, TMember, TName ) \
    so.BindMember( soname, &soobj, &soobj.TMember, new TSettingElement(TName) );

#define BIND_SO_ENUM( TEnumType, TMember ) \
    so.BindMember( soname, &soobj, &soobj.TMember, new TSettingEnum(#TMember + 1, #TEnumType + 1) );

#define BIND_SO_ENUM_NAME( TEnumType, TMember, TName ) \
    so.BindMember( soname, &soobj, &soobj.TMember, new TSettingEnum(TName, #TEnumType + 1) );

#define BIND_SETTINGOBJECT_END }

�l�定代码如下

        BIND_SETTINGOBJECT_BEGIN( RasterizerState )
            BIND_SO_ENUM    ( eFillMode    , mFillMode )
            BIND_SO_ENUM    ( eCullMode    , mCullMode )
            BIND_SO_MEMBER    ( bool        , mFrontFaceCCW )
            BIND_SO_MEMBER    ( float        , mDepthBias )
            BIND_SO_MEMBER    ( float        , mSlopeScaledDepthBias)
            BIND_SO_MEMBER    ( bool        , mDepthClipEnable)
            BIND_SO_MEMBER    ( bool        , mScissorEnable)
            BIND_SO_MEMBER    ( bool        , mMultisampleEnable)
        BIND_SETTINGOBJECT_END

所有结构体的信息被记录在SettingObject中，��d��配置文�g填充�l�构体的��d��变得异常的��单了

    SettingObject settings;
// ���所有的�l�构体信息记�?/span>
    InitRenderStateObjectSetting( settings );

    const NameRef& rzname = DepthStencilState::StaticGetClassInfo()->mClassName;

    DepthStencilState a;
 // �q�里���是���配�|�文件的信息填充到结构体
    settings.SetMember( rzname, &a, "BackFace.StencilFunc", "Equal" );

战魂��筑 2010-02-26 17:58 发表评论

设计D3D9 HLSL渲染脚本

战魂��筑 — Mon, 15 Feb 2010 15:18:00 GMT

最�q�翻出很早之前自己写的一套��用Direct3D 9 Effect�pȝ��的纯shader 3d引擎�Q�打��用最新技术重写。重写的主要修改在于�Q?/p>

1. ��L��Effect�pȝ��Q�改用HLSL + 渲染脚本

2. 优化渲染接口�Q��用材质统一shader和渲染状�?/p>

随即参考了DirectX SDK的Graphics部分文档�Q�DirectX9 时代的Effect�pȝ��U��a只是一个HLSL的简单渲染脚本实玎ͼ�除了DXUT�Q�FXComposer�{�极��程序��用这套东西外�Q�大型的引擎很少使用�q�种半成品系�l�。到了DirectX10甚至11�Q�因为架构更改，��L��固定��线�Q�因此Effect成�ؓ(f��)较�ؓ(f��)高效和便��L(f��ng)��渲染脚本�Q�如果不是要求较高的3d引擎�Q�一般的游戏使用DirectX10的Effect渲染脚本�q�是很不错的�?/p>

DX10的fx脚本与DX9的差异在�?/p>

渲染状态，采样器状态等都变为对象，�q�与API高度�l�一

在脚本与API中均可以讄��

DepthStencilState EnableDepth
{
    DepthEnable = TRUE;
    DepthWriteMask = ALL;
    DepthFunc = LESS_EQUAL;
};

BlendState NoBlending
{
AlphaToCoverageEnable = FALSE;
BlendEnable[0] = FALSE;
};

technique10 Render
{
pass P0
{

        SetDepthStencilState( EnableDepth, 0 );
        SetBlendState( NoBlending, float4( 0.0f, 0.0f, 0.0f, 0.0f ), 0xFFFFFFFF );
    }
}

本�h觉得�Q�这��L(f��ng)��设计让图形API更�ؓ(f��)敏捷与归�c�d��Q�另外，也便于StateManager或者自己做渲染状态�{�U�d��差异比较时更为高�?

Vista操作�pȝ��推出很久后，DX10的显卡也占有了大量的市场份额。但是由于DX10仍然是一个过渡API�Q�类��g��DX8)�Q�因此，很多3D游戏要么仍然支持DX9�Q�要不然��x��持DX9也支持DX10�Q�甚至DX11.

看博客上有达人组团编写类似DX10接口和系�l�的软渲染，DX10的设计是优秀的。因此，在DX9 HLSL基础上，�l�合自己�~�写的渲染脚本会(x��)是非常好的选择�?

渲染脚本我的设计思�\是这��L(f��ng)��Q?

1. 只是一�U�预处理脚本�Q��ƈ非实时运行脚本�?

�~�译器将文本解析后，转化��Z��些运行指令，比如�Q�本pass使用一块小�U�理�Q�下一pass的target是这个纹理，�q�且开启哪些渲染状态�?

2. 自定义格式的解析脚本�?

使用lua�Q�python�{�脚本其实也是可以的。但是在出现错误�Ӟ��报出的错可能�?x��)让不熟�?zh��n)�这个脚本语�a�的�h莫名其妙�?

使用��N��sq脚本语言�Q�可惜其在lua基础上，对table的slot初次赋值时必须使用<-而不是统一使用=�Q�因此会(x��)让你的脚本稀奇古�?

XML脚本�Q?XML可以避免复杂的语法检查，写完��是归整的，但也是罗嗦的�Q�本来Texture[2]可以表达完毕的，非要来罗嗦下�?

OGRE的compositor脚本和材质脚本就是自��p��析的�Q�不�q�出乎预料的使用了BNF范式�q�类较�ؓ(f��)正规的方法。这��是��_(d��)��需要先解析BNF表达式，然后再输入脚本解析，�~�写�q�程和系�l�复杂度�?x��)变得异常复杂�?

最�l�选择�q�是使用自己解析的脚本，使用一些具体代码结构来替代BNF�q�类高深的东�?

军_��以后�Q�下一步需要制定渲染脚本具体各部分及制作过�E?

1. 基本lexer

从文本得到各�U�token

1. 渲染状态对�?

照着DX10抄就�?

2. Shader导入�?

shader文�g来自于何处，入口怎样定义

3. 渲染脚本VM及指�?

军_��一个纹理怎样讄��Q�RenderTarget怎样使用�{�的指��o

战魂��筑 2010-02-15 23:18 发表评论