original address:
http://blog.csdn.net/starflash2003/archive/2004/10/08/128688.aspx
引言
高層著色語言(HLSL)是DirectX® 9最為強(qiáng)力的新組件之一。使用這種標(biāo)準(zhǔn)的高級語言, 在進(jìn)行著色時(shí)編寫者可以專注于算法而不用再去理會諸如寄存器的分配,寄存器讀端口限制, 并行處理指令等等硬件細(xì)節(jié). 除了把開發(fā)者從硬件細(xì)節(jié)中解放出來之外,HLSL 也具有高級語言所有的全部優(yōu)勢,諸如:代碼重用容易, 可讀性增強(qiáng)以及存在一個(gè)優(yōu)化過的編譯器。本書和 ShaderX2 - Shader Tips & Tricks 這本書的許多章節(jié)就用到了HLSL編寫的著色器. 閱讀完本章引言后,你會很容易理解那些著色器并在工作中用到它們。
這一章, 我們概述語言本身的基本結(jié)構(gòu)以及將HLSL集成到你的應(yīng)用程序中的方法。
一個(gè)簡單的示例
在徹底描述HLSL之前, 讓我們先看一下程序中HLSL頂點(diǎn)著色和HLSL像素著色的實(shí)現(xiàn),這個(gè)程序渲染簡單的木紋。下邊顯示的第一個(gè)HLSL著色是一個(gè)簡單的頂點(diǎn)著色:
float4x4 view_proj_matrix;
float4x4 texture_matrix0;
struct VS_OUTPUT
{ float4 Pos : POSITION;
float3 Pshade : TEXCOORD0;
};
VS_OUTPUT main (float4 vPosition : POSITION)
{
VS_OUTPUT Out = (VS_OUTPUT) 0; //Transform position to clip space
Out.Pos = mul (view_proj_matrix, vPosition); // Transform Pshade Out.Pshade = mul (texture_matrix0, vPosition);
return Out;}
最開始兩行聲明了一對4×4的矩陣,分別命名為view_proj_matrix和texture_matrix0。在全局矩陣之后,聲明了一個(gè)結(jié)構(gòu)體。這個(gè)VS_OUTPUT
有兩個(gè)成員:Pos和Pshade。
該著色器的main函數(shù)接受一個(gè)單精度float4類型的輸入?yún)?shù)并返回一個(gè)VS_OUTPUT結(jié)構(gòu)體。float4類型的vPosition是著色器唯一的輸入,返回的VS_OUTPUT結(jié)構(gòu)體定義了該頂點(diǎn)著色器的輸出。目前不必關(guān)心在參數(shù)和結(jié)構(gòu)體之后的關(guān)鍵字POSITION和TEXCOORD0。它們被稱為語義,他們的含義將在本章后邊討論。
看一下main函數(shù)的實(shí)際代碼部分,你可以看到一個(gè)內(nèi)部函數(shù)mul,它被用來把輸入的向量vPosition和矩陣view_proj_matrix相乘。在頂點(diǎn)著色器中這個(gè)函數(shù)最常被用來執(zhí)行頂點(diǎn)-矩陣的乘法。就這樣,vPosition被作為列向量,因?yàn)樗莔ul的第二個(gè)參數(shù)。如果向量 vPosition是mul的第一個(gè)參數(shù),它將被作為行向量。內(nèi)部函數(shù)mul以及其他內(nèi)部函數(shù)將在本章后邊更詳細(xì)的討論。在把輸入的vPosition的位置轉(zhuǎn)換換到裁減空間之后,vPosition與另一個(gè)矩陣texture_matrix0相乘以產(chǎn)生3D紋理坐標(biāo)。兩次轉(zhuǎn)換的結(jié)果寫入返回的結(jié)構(gòu)體 VS_OUTPUT。一個(gè)頂點(diǎn)著色器必須總是以最小值輸出到一個(gè)裁減空間位置。任何從頂點(diǎn)著色器輸出的額外值都是通過貫穿光柵化多邊型插值得到的,也可用來輸入到像素著色器。就這樣,通過一個(gè)內(nèi)插器, 三維的Pshade從頂點(diǎn)著色器被傳遞到像素著色器。
下邊,我們看到一個(gè)簡單的HLSL木紋像素著色器。這個(gè)像素著色器和剛才我們描述的頂點(diǎn)著色器一起工作,它將被編譯成模型ps_2_0。
float4 lightWood; // xyz == Light Wood
Colorfloat4 darkWood; // xyz == Dark Wood
Colorfloat ringFreq; // ring
frequencysampler PulseTrainSampler;
float4 hlsl_rings (float4 Pshade : TEXCOORD0) : COLOR
{
float scaledDistFromZAxis = sqrt(dot(Pshade.xy, Pshade.xy)) * ringFreq;
float blendFactor = tex1D (PulseTrainSampler, scaledDistFromZAxis);
return lerp (darkWood, lightWood, blendFactor);
}
最開始幾行在全局范圍內(nèi)聲明了一對浮點(diǎn)類型的四元數(shù)組和一個(gè)浮點(diǎn)變量。在這些變量之后,聲明了一個(gè)被稱為PulseTrainSampler的取樣器。取樣器將在章節(jié)后邊討論,目前你可以把它看成一個(gè)在顯存中的窗口,它與過濾狀態(tài)和紋理坐標(biāo)尋址模式發(fā)生關(guān)聯(lián)。在變量和取樣器聲明后邊是著色器代碼的主體部分。你可以看到有一個(gè)輸入?yún)?shù)Pshade,它是貫穿多邊形插值得到的。它的值是由頂點(diǎn)著色器計(jì)算每一個(gè)頂點(diǎn)得出的。在像素著色器中,把著色空間Z軸上的笛卡爾距離作為一維紋理坐標(biāo)來計(jì)算,衡量,使用,以存取綁定于PulseTrainSampler的紋理。tex1D()取樣函數(shù)返回的顏色標(biāo)量被用作混合因子,以混合在著色器全局范圍內(nèi)聲明的兩種相反顏色。像素著色器最終輸出一個(gè)混合的四元向量結(jié)果。所有的像素著色器至少必須返回一個(gè)四元 RGBA 顏色。我們將在稍后章節(jié)中討論像素著色器的附加選項(xiàng)。
匯編語言和編譯對象
既然我們已經(jīng)了解了一些HLSL著色器,這里簡要討論一下如何在代碼中涉及Direct3D,D3DX,匯編著色器模型和你的程序。DirectX 8中第一次把著色器引入了Direct3D。在那個(gè)時(shí)候,這些虛擬著色器是這樣定義的——每一個(gè)大致相當(dāng)于一個(gè)特殊的3D硬件商生產(chǎn)的圖形處理器。每個(gè)虛擬著色器都設(shè)計(jì)有匯編語言。在DirectX 8.0和DirectX 8.1中,編寫這些著色器模型的程序(被命名為vs_1_1以及ps_1_1直到ps_1_4)相對短小并且一般由開發(fā)者直接用合適的匯編語言編寫。如圖 1左所示,憑借D3DXAssembleShader()程序把人們可讀的匯編語言代碼傳遞給D3DX庫并返回著色器的二進(jìn)制表示,該二進(jìn)制表示由 CreatePixelShader()或CreateVertexShader()依次傳遞給Direct3D。更多傳統(tǒng)匯編著色模型的細(xì)節(jié),請參考在線和離線資源,包括Shader X 和DirectX SDK。
圖1. Use of D3DX for Assembly and Compilation in DirectX 8 and DirectX 9
如圖1右所示,在DirectX 9中的情形非常相似,憑借D3DXCompileShader() API,程序把HLSL著色器傳遞給D3DX并返回編譯后著色器的二進(jìn)制表示,該二進(jìn)制表示由CreatePixelShader()或 CreateVertexShader()輪流傳遞給Direct3D。生成的二進(jìn)制匯編代碼是一個(gè)函數(shù),它只取決于選擇的編譯對象,而不是什么用戶或開發(fā)者系統(tǒng)上的特殊圖形設(shè)備。就是說,生成的二進(jìn)制匯編程序與平臺無關(guān),即可在任何地方編譯或運(yùn)行。事實(shí)上,Direct3D運(yùn)行時(shí)本身并不知道HLSL的任何內(nèi)容,除了二進(jìn)制匯編著色器模型。這樣做很有好處因?yàn)檫@就意味著 HLSL編譯器的更新不必依賴于Direct3D運(yùn)行時(shí)。事實(shí)上,在2003年夏季末本書截稿與首印期之間,Microsoft開始計(jì)劃發(fā)布含有更新過的 HLSL編譯器的DirectX SDK更新。
除了D3DX中HLSL編譯器的開發(fā)之外,DirectX 9.0也提出了另外的匯編層著色器模型以展示最新的3D圖形硬件的功能。直接使用匯編語言為新的模型(vs_2_0,vs_3_0,ps_2_0和ps_3_0) 做開發(fā),程序開發(fā)人員會感到自由,不過我們希望絕大多數(shù)開發(fā)人員都轉(zhuǎn)移到HLSL從而專注于著色器的開發(fā)。
實(shí)際的硬件
當(dāng)然,僅僅因?yàn)槟憧梢詫懸粋€(gè)HLSL程序來表達(dá)一個(gè)特殊的著色算法不等于它能夠在硬件上運(yùn)行。前面已經(jīng)討論過,應(yīng)用程序通過調(diào)用D3DX中的 D3DXCompileShader() API把HLSL著色器編譯成二進(jìn)制匯編程序。這個(gè)API的入口參數(shù)之一是這樣一個(gè)參數(shù):它定義了HLSL編譯器使用哪一個(gè)匯編語言模型(或編譯對象)來表示最終著色器代碼。如果一個(gè)程序在運(yùn)行時(shí)執(zhí)行HLSL著色器編譯,程序會檢測Direct3D設(shè)備的性能并選擇匹配的編譯對象。如果HLSL著色器中的算法太復(fù)雜以至于不能在選擇的編譯對象上執(zhí)行,編譯將會失敗。這意味著盡管HLSL大大有利于著色器的開發(fā),卻不會把開發(fā)人員從這么一個(gè)現(xiàn)實(shí)中解放出來:把游戲封裝后給擁有各種性能圖形設(shè)備的用戶。作為一個(gè)游戲開發(fā)人員,你仍然得為你的圖像處理好一系列步驟,為更好的顯示卡編寫更好的著色器,為較老的卡編寫更基本的。不過,有了編寫完善的HLSL,負(fù)擔(dān)可以大大減輕。
編譯失敗
如上所述, 給定的HLSL著色器編譯特殊對象的失敗說明對于編譯對象來說著色器太過復(fù)雜。這就意味著著色器需要大量的資源或是需要一些諸如動(dòng)態(tài)分支(不被所選編譯對象所支持)的功能。例如,某個(gè)HLSL著色器可能被編寫用于在一個(gè)著色器內(nèi)存取所給定的六重紋理貼圖。如果這個(gè)著色器被編譯成ps_1_1, 編譯將會失敗,因?yàn)閜s_1_1模型只支持四重紋理。其他編譯失敗的通常原因是超過了所選編譯對象的最大指令計(jì)數(shù)器。某個(gè)HLSL中表示的算法也許僅僅需要大量指令而使得給定的編譯對象不能被執(zhí)行。
要重點(diǎn)注意的是所選編譯對象不會限定編寫人員所使用的HLSL語法。例如,著色器編寫人員會使用'for'循環(huán),子程序,'if-else'等等語句,編譯本身不支持循換,分支或'if-else'語句的對象。這種情況下,編譯器將展開循環(huán),內(nèi)聯(lián)函數(shù)調(diào)用并同時(shí)執(zhí)行'if-else'語句的兩個(gè)分支(譯者注:即if與else后的語句全都執(zhí)行),根據(jù)'if-else'語句中所使用的原始值選擇合適的結(jié)果。當(dāng)然,如果最后所得到的著色器(程序)太長或相反超出了編譯對象的資源,編譯將失敗。
命令行編譯器: FXC
許多開發(fā)人員選擇在著色器被封裝之前把它從HLSL編譯成二進(jìn)制匯編語言,而不是在正在使用D3DX的客戶機(jī)器上當(dāng)程序載入時(shí)或首次運(yùn)行時(shí)編譯HLSL著色器。這保證了HLSL源代碼不被窺視,同時(shí)也確保所有其程序能夠永久運(yùn)行的著色器已經(jīng)通過其內(nèi)部質(zhì)量確認(rèn)流程。在DirectX 9.0 SDK中提供了一個(gè)方便的命令行編譯程序fxc允許開發(fā)人員脫機(jī)編譯著色器。該程序有許多方便的選項(xiàng),你不但可以以命令行方式編譯你的著色器,也能產(chǎn)生指定編譯對象的反匯編代碼。如果你想優(yōu)化你的著色器或只是想更詳細(xì)的了解虛擬著色器的性能,在開發(fā)期間研究輸出的反匯編代碼是非常有用的。表1列出了這些命令行選項(xiàng)。
表1. FXC 命令行選項(xiàng)
-T target |
編譯對象 (默認(rèn): vs_2_0) |
-E name |
入口點(diǎn) name (默認(rèn): main) |
-Od |
禁止優(yōu)化 |
-Vd |
禁止確認(rèn) |
-Zi |
允許調(diào)試信息 |
-Zpr |
按照行順序挑選矩陣 |
-Zpc |
按照列順序挑選矩陣 |
-Fo file |
輸出目標(biāo)文件 |
-Fc file |
輸出所生成代碼的列表 |
-Fh file |
輸出含有生成代碼的頭部 |
-D id=text |
定義宏 |
-nologo |
沒有版權(quán)信息 |
既然你了解了用于著色器開發(fā)的HLSL編譯器的內(nèi)容,我們就可以討論實(shí)際的語言結(jié)構(gòu)了。 在我們繼續(xù)下面內(nèi)容的時(shí)候,頭腦里要一直保留著編譯對象的概念以及潛在的匯編著色器模型的不同性能,這很重要。
posted on 2007-11-13 02:29
七星重劍 閱讀(831)
評論(0) 編輯 收藏 引用 所屬分類:
Game Graphics 、
HLSL&ShaderMonkey