軟陰影
www.GameDev.net 作者:Anirudh.S Shastry
http://www.gamedev.net/reference/articles/article2193.asp
譯者:赟赟
介紹... 1
近況... 1
軟陰影... 2
那么它如何工作?... 2
步驟一:渲染陰影映射圖(shadow map)... 2
步驟二:將帶陰影的場景渲染到緩沖中... 4
步驟三:對屏幕緩沖進行模糊... 7
步驟四:渲染帶陰影的場景... 11
參考文獻... 13
最初,動態陰影技術只有在有限的幾種情況下才能實現。但是,隨著強大的可編程圖形硬件的面世,動態陰影技術已經完全取代了以前的如light map這樣的靜態陰影技術及像projected shadows這樣的半動態陰影技術。目前兩種流行的動態陰影技術分別是shadow volumes和shadow mapping。
shadow volumes技術是一種基于幾何形體的技術,它需要幾何體在一定方向的燈光下的輪廓去產生一個封閉的容積,然后通過光線的投射就可以決定場景的陰影部分(常常使用模板緩沖去模擬光線的投射)。這項技術是像素精確的,不會產生任何的鋸齒現象,但是與其他的技術一樣,它也有缺點。最主要的兩個問題一是極度依賴幾何形體,二是需要非常高的填充率。由于這些缺點,使得shadow mapping技術漸漸地變得更為流行起來。
陰影映射技術是一種圖像空間的技術,它首先在以光源位置作為視點的情況下渲染整個場景的深度信息,然后再使用這些深度信息去決定場景的哪一部分是處于陰影之中。雖然這項技術有許多優點,但它有鋸齒現象并且依賴z-緩沖技術。不過它的優點足以抵消它的這些缺點,因此本文選用了這項技術。
硬陰影破壞了場景的真實性,因此,我們必須仿造軟陰影來提升場景的可視效果。許多狂熱的學者都拿出了描述軟陰影技術的論文。但實際上,這些技術大部分都是很難在一個較為復雜的場景下實現實時效果。直到我們擁有了能克服這些技術局限性的硬件后,我們才真正的采用了這些方法。
本文采用了基于圖像空間的方法,并利用shadow mapping技術來產生軟陰影。這個方法不能產生完美的陰影,因為沒有真正的模擬出本影和半影,但它不僅僅可以解決陰影映射技術的鋸齒現象,還能以賞心悅目的軟陰影來提升場景的可視效果。
首先,我們生成陰影映射圖(shadow map),具體方法是以光源位置為視點,將場景的深度信息渲染到浮點格式的緩沖中去。然后我們不是像通常那樣在陰影下渲染場景,而是將陰影區域渲染到一幅屏幕大小的緩沖中去,這樣就可以使用bloom filter進行模糊并將它投射回屏幕空間中使其顯示在屏幕上。是不是很簡單?
本文只處理了聚光燈源這種情況,但可以很方便的推廣到點光源上。
下面是具體步驟:
通過將深度信息寫入浮點紋理的方法產生陰影映射圖(shadow map)。
深度比較后將場景的陰影部分渲染到定點紋理,此時不要任何的燈光。
使用bloom filter模糊上一步的紋理,本文采用了separable Gaussian filter,也可用其他的方法。
在所有的光源下將上一步模糊后的紋理投射到屏幕空間中,從而得到最終的效果。
步驟一:渲染陰影映射圖(shadow map)
首先,我們需要創建一個能保存屏幕深度信息的紋理。因為要把這幅紋理作為render target,所以我們還要創建一個表面(surface)來保存紋理的表面信息。由于深度信息值的范圍很大因此這幅紋理必須是浮點類型的。R32F的格式有足夠的精度可以滿足我們的需要。下面是創建紋理的代碼片斷:
if( FAILED( g_pd3dDevice->CreateTexture( SHADOW_MAP_SIZE,
SHADOW_MAP_SIZE, 1, D3DUSAGE_RENDERTARGET,
D3DFMT_R32F, D3DPOOL_DEFAULT, &g_pShadowMap,
NULL ) ) )
{
MessageBox( g_hWnd, "Unable to create shadow map!",
"Error", MB_OK | MB_ICONERROR );
return E_FAIL;
}
g_pShadowMap->GetSurfaceLevel( 0, &g_pShadowSurf );
為了完成陰影映射圖,我們要把場景的深度信息渲染到陰影映射圖中。為此在光源的世界-視點-投影變換矩陣(world-view-projection matrix)下渲染整個場景。下面是構造這些矩陣的代碼:
D3DXMatrixLookAtLH( &matView, &vLightPos, &vLightAim, &g_vUp );
D3DXMatrixPerspectiveFovLH( &matProj, D3DXToRadian(30.0f),
1.0f, 1.0f, 1024.0f );
//實際上作者在例程中使用的是D3DXMatrixOrthoLH( &matProj, 45.0f, 45.0f, 1.0f, //1024.0f )。這個函數所構造的project矩陣與D3DXMatrixPerspectiveFovLH()構造的//不同之處在于:它沒有透視效果。即物體的大小與視點和物體的距離沒有關系。顯然例//程中模擬的是平行光源(direction light),而這里模擬的是聚光燈源(spot light不知翻譯得對不對?)
matLightViewProj = matWorld * matView * matProj;
下面是渲染場景深度的頂點渲染和像素渲染的代碼:
struct VSOUTPUT_SHADOW
{
float4 vPosition : POSITION;
float fDepth : TEXCOORD0;
};
VSOUTPUT_SHADOW VS_Shadow( float4 inPosition : POSITION )
{
VSOUTPUT_SHADOW OUT = (VSOUTPUT_SHADOW)0;
OUT.vPosition = mul( inPosition, g_matLightViewProj );
OUT.fDepth = OUT.vPosition.z;
return OUT;
}
這里我們將頂點的位置與變換矩陣相乘,并將變換后的z值作為深度。在像素渲染中將深度值以顏色(color)的方式輸出。
float4 PS_Shadow( VSOUTPUT_SHADOW IN ) : COLOR0
{
return float4( IN.fDepth, IN.fDepth, IN.fDepth, 1.0f );
}
瞧,我們完成了陰影映射圖,下面就是以顏色方式輸出的陰影映射圖,深藍色部分表明較小的深度值,淺藍色部分表明較大的深度值。
下面,我們要把場景的帶陰影的部分渲染到并不立即顯示的緩沖中,使我們可以進行模糊處理,然后再將它投射回屏幕。首先把場景的陰影部分渲染到一幅屏幕大小的定點紋理中。
if( FAILED( g_pd3dDevice->CreateTexture( SCREEN_WIDTH,
SCREEN_HEIGHT, 1, D3DUSAGE_RENDERTARGET,
D3DFMT_A8R8G8B8, D3DPOOL_DEFAULT,
&g_pScreenMap, NULL ) ) )
{
MessageBox( g_hWnd, "Unable to create screen map!",
"Error", MB_OK | MB_ICONERROR );
return E_FAIL;
}
g_pScreenMap->GetSurfaceLevel( 0, & g_pScreenSurf );
為了獲得投影紋理坐標(projective texture coordinates),我們需要一個紋理矩陣,作用是把投影空間(projection space)中的位置變換到紋理空間(texture space)中去。
float fTexOffs = 0.5 + (0.5 / (float)SHADOW_MAP_SIZE);
D3DXMATRIX matTexAdj( 0.5f, 0.0f, 0.0f, 0.0f,
0.0f, -0.5f, 0.0f, 0.0f,
0.0f, 0.0f, 1.0f, 0.0f,
fTexOffs, fTexOffs, 0.0f, 1.0f );
//這個矩陣是把projection space中范圍為[-1,1]的x,y坐標值轉換到紋理空間中
//[0,1]的范圍中去。注意y軸的方向改變了。那個(0.5 / (float)SHADOW_MAP_SIZE)
//的值有什么作用我還不清楚,原文也沒有說明。
matTexture = matLightViewProj * matTexAdj;
我們像往常那樣通過深度的比較來獲得陰影因數,但隨后并不是像平常那樣輸出整個照亮了的場景,我們只輸出陰影因數。下面的頂點渲染和像素渲染完成這個工作。
struct VSOUTPUT_UNLIT
{
float4 vPosition : POSITION;
float4 vTexCoord : TEXCOORD0;
float fDepth : TEXCOORD1;
};
VSOUTPUT_UNLIT VS_Unlit( float4 inPosition : POSITION )
{
VSOUTPUT_UNLIT OUT = (VSOUTPUT_UNLIT)0;
OUT.vPosition = mul( inPosition, g_matWorldViewProj );
OUT.vTexCoord = mul( inPosition, g_matTexture );
OUT.fDepth = mul( inPosition, g_matLightViewProj ).z;
return OUT;
}
我們采用percentage closer filtering (PCF)來平滑鋸齒邊緣。為了完成“PCF”,我們簡單的對周圍8個紋理點進行采樣,并取得它們深度比較的平均值。
tex2Dproj()函數以及轉換到紋理空間的向量(x,y,z,w)對紋理進//行采樣。這與d3d9sdk中shadowmap例子用tex2D()及向量(x,y)進行采樣不同。具體//區別及原因很容易從程序中看出,我就不再啰嗦了。
float4 PS_Unlit( VSOUTPUT_UNLIT IN ) : COLOR0
{
float4 vTexCoords[9];
float fTexelSize = 1.0f / 1024.0f;
VTexCoords[0] = IN.vTexCoord;
vTexCoords[1] = IN.vTexCoord + float4( -fTexelSize, 0.0f, 0.0f, 0.0f );
vTexCoords[2] = IN.vTexCoord + float4( fTexelSize, 0.0f, 0.0f, 0.0f );
vTexCoords[3] = IN.vTexCoord + float4( 0.0f, -fTexelSize, 0.0f, 0.0f );
vTexCoords[6] = IN.vTexCoord + float4( 0.0f, fTexelSize, 0.0f, 0.0f );
vTexCoords[4] = IN.vTexCoord + float4( -fTexelSize, -fTexelSize, 0.0f, 0.0f );
vTexCoords[5] = IN.vTexCoord + float4( fTexelSize, -fTexelSize, 0.0f, 0.0f );
vTexCoords[7] = IN.vTexCoord + float4( -fTexelSize, fTexelSize, 0.0f, 0.0f );
vTexCoords[8] = IN.vTexCoord + float4( fTexelSize, fTexelSize, 0.0f, 0.0f );
float fShadowTerms[9];
float fShadowTerm = 0.0f;
for( int i = 0; i < 9; i++ )
{
float A = tex2Dproj( ShadowSampler, vTexCoords[i] ).r;
float B = (IN.fDepth - 0.1f);
fShadowTerms[i] = A < B ? 0.0f : 1.0f;
fShadowTerm += fShadowTerms[i];
}
fShadowTerm /= 9.0f;
return fShadowTerm;
}
屏幕緩沖完成了,我們還需要進行模糊工作。
我們采用seperable gaussian filter模糊屏幕緩沖。但我們也可以用Poisson filter。這次的render targets是A8R8G8B8的紋理和相關的表面。我們需要兩個render targets,一個進行水平階段,一個進行垂直階段。
for( int i = 0; i < 2; i++ )
{
if( FAILED( g_pd3dDevice->CreateTexture( SCREEN_WIDTH,
SCREEN_HEIGHT, 1, D3DUSAGE_RENDERTARGET,
D3DFMT_A8R8G8B8, D3DPOOL_DEFAULT,
&g_pBlurMap[i], NULL ) ) )
{
MessageBox( g_hWnd, "Unable to create blur map!",
"Error", MB_OK | MB_ICONERROR );
return E_FAIL;
}
g_pBlurMap[i]->GetSurfaceLevel( 0, & g_pBlurSurf[i] );
}
我們用下面的代碼生成15個高斯偏移量(Gaussian offsets)及他們的權重(corresponding weights)。
float GetGaussianDistribution( float x, float y, float rho )
{
float g = 1.0f / sqrt( 2.0f * 3.141592654f * rho * rho );
return g * exp( -(x * x + y * y) / (2 * rho * rho) );
}
void GetGaussianOffsets( bool bHorizontal,
D3DXVECTOR2 vViewportTexelSize,
D3DXVECTOR2* vSampleOffsets,
float* fSampleWeights )
{
fSampleWeights[0] = 1.0f * GetGaussianDistribution( 0, 0, 2.0f );
vSampleOffsets[0] = D3DXVECTOR2( 0.0f, 0.0f );
if( bHorizontal )
{
for( int i = 1; i < 15; i += 2 )
{
vSampleOffsets[i + 0] = D3DXVECTOR2( i * vViewportTexelSize.x, 0.0f );
vSampleOffsets[i + 1] = D3DXVECTOR2( -i * vViewportTexelSize.x, 0.0f );
fSampleWeights[i + 0] = 2.0f * GetGaussianDistribution( float(i + 0), 0.0f, 3.0f );
fSampleWeights[i + 1] = 2.0f * GetGaussianDistribution( float(i + 1), 0.0f, 3.0f );
}
}
else
{
for( int i = 1; i < 15; i += 2 )
{
vSampleOffsets[i + 0] = D3DXVECTOR2( 0.0f, i * vViewportTexelSize.y );
vSampleOffsets[i + 1] = D3DXVECTOR2( 0.0f, -i * vViewportTexelSize.y );
fSampleWeights[i + 0] = 2.0f * GetGaussianDistribution( 0.0f, float(i + 0), 3.0f );
fSampleWeights[i + 1] = 2.0f * GetGaussianDistribution( 0.0f, float(i + 1), 3.0f );
}
}
}
為了模糊屏幕緩沖,我們將模糊映射圖(blur map)作為render target,使用下面的頂點渲染和像素渲染代碼渲染一個與屏幕等大的方塊。
// 作者在程序中預先定義的屏幕大小是1024 * 768,而隨后定義的與屏幕等大的方塊為:
// pVertices[0].p = D3DXVECTOR4( 0.0f, 0.0f, 0.0f, 1.0f );
// pVertices[1].p = D3DXVECTOR4( 0.0f, 768 / 2, 0.0f, 1.0f );
// pVertices[2].p = D3DXVECTOR4( 1024 / 2, 0.0f, 0.0f, 1.0f );
// pVertices[3].p = D3DXVECTOR4( 1024 / 2, 768 / 2, 0.0f, 1.0f );
// 這種方法與d3dsdk中HDRLight中獲得render target 的width and height然后再構造的// 方法不同:
// svQuad[0].p = D3DXVECTOR4(-0.5f, -0.5f, 0.5f, 1.0f);
// svQuad[1].p = D3DXVECTOR4(Width-0.5f, -0.5f, 0.5f, 1.0f);
// svQuad[2].p = D3DXVECTOR4(-0.5f, Height-0.5f, 0.5f, 1.0f);
// svQuad[3].p = D3DXVECTOR4(Width-0.5f,fHeight-0.5f, 0.5f, 1.0f);
// 而一般定義的窗口大小往往與從render target獲得的width and height不相同。
// 而二者的fvf都是D3DFVF_XYZRHW。這兩種方法有什么區別我一直沒想通。
struct VSOUTPUT_BLUR
{
float4 vPosition : POSITION;
float2 vTexCoord : TEXCOORD0;
};
VSOUTPUT_BLUR VS_Blur( float4 inPosition : POSITION, float2 inTexCoord : TEXCOORD0 )
{
VSOUTPUT_BLUR OUT = (VSOUTPUT_BLUR)0;
OUT.vPosition = inPosition;
OUT.vTexCoord = inTexCoord;
return OUT;
}
float4 PS_BlurH( VSOUTPUT_BLUR IN ): COLOR0
{
float4 vAccum = float4( 0.0f, 0.0f, 0.0f, 0.0f );
for(int i = 0; i < 15; i++ )
{
vAccum += tex2D( ScreenSampler, IN.vTexCoord + g_vSampleOffsets[i] ) * g_fSampleWeights[i];
}
return vAccum;
}
float4 PS_BlurV( VSOUTPUT_BLUR IN ): COLOR0
{
float4 vAccum = float4( 0.0f, 0.0f, 0.0f, 0.0f );
for( int i = 0; i < 15; i++ )
{
vAccum += tex2D( BlurHSampler, IN.vTexCoord + g_vSampleOffsets[i] ) * g_fSampleWeights[i];
}
return vAccum;
}
這里,模糊映射圖已經完成了,為了增加陰影的模糊程度,增加了紋理上點的采樣距離。最后一步自然是將模糊后的紋理圖投射回屏幕空間使其顯示在屏幕上。
After first Gaussian pass
After second Gaussian pass
為了將模糊后的紋理投射到屏幕上,我們像平常那樣渲染場景,但投影模糊后的紋理時要使用屏幕空間的坐標。我們使用裁剪空間的坐標和一些數學方法來產生屏幕空間的坐標。下面的頂點渲染和像素渲染將完成這個工作:
struct VSOUTPUT_SCENE
{
float4 vPosition : POSITION;
float2 vTexCoord : TEXCOORD0;
float4 vProjCoord : TEXCOORD1;
float4 vScreenCoord : TEXCOORD2;
float3 vNormal : TEXCOORD3;
float3 vLightVec : TEXCOORD4;
float3 vEyeVec : TEXCOORD5;
};
VSOUTPUT_SCENE VS_Scene( float4 inPosition : POSITION,
float3 inNormal : NORMAL,
float2 inTexCoord : TEXCOORD0 )
{
VSOUTPUT_SCENE OUT = (VSOUTPUT_SCENE)0;
OUT.vPosition = mul( inPosition, g_matWorldViewProj );
OUT.vTexCoord = inTexCoord;
OUT.vProjCoord = mul( inPosition, g_matTexture );
裁剪空間的坐標轉換到屏幕空間的坐標,方法和裁剪空間的坐標轉換
// 紋理空間的坐標的方法很相似。
OUT.vScreenCoord.x = ( OUT.vPosition.x * 0.5 + OUT.vPosition.w * 0.5 );
OUT.vScreenCoord.y = ( OUT.vPosition.w * 0.5 - OUT.vPosition.y * 0.5 );
OUT.vScreenCoord.z = OUT.vPosition.w;
OUT.vScreenCoord.w = OUT.vPosition.w;
float4 vWorldPos = mul( inPosition, g_matWorld );
OUT.vNormal = mul( inNormal, g_matWorldIT );
OUT.vLightVec = g_vLightPos.xyz - vWorldPos.xyz;
OUT.vEyeVec = g_vEyePos.xyz - vWorldPos.xyz;
return OUT;
}
float4 PS_Scene( VSOUTPUT_SCENE IN ) : COLOR0
{
IN.vNormal = normalize( IN.vNormal );
IN.vLightVec = normalize( IN.vLightVec );
IN.vEyeVec = normalize( IN.vEyeVec );
float4 vColor = tex2D( ColorSampler, IN.vTexCoord );
float ambient = 0.0f;
float diffuse = max( dot( IN.vNormal, IN.vLightVec ), 0 );
float specular = pow(max(dot( 2 * dot( IN.vNormal, IN.vLightVec ) * IN.vNormal
- IN.vLightVec, IN.vEyeVec ), 0 ), 8 );
if( diffuse == 0 ) specular = 0;
float fShadowTerm = tex2Dproj( BlurVSampler, IN.vScreenCoord );
float fSpotTerm = tex2Dproj( SpotSampler, IN.vProjCoord );
return (ambient * vColor) +
(diffuse * vColor * g_vLightColor * fShadowTerm * fSpotTerm) +
(specular * vColor * g_vLightColor.a * fShadowTerm * fSpotTerm);
}
終于完成了。看上去不錯。該技術的優點一是解決了鋸齒問題,二是在多光源,低內存下實現了軟陰影。另外該技術與陰影生成方法無關,可以很容易的在shadow volumes技術中采用這項技術。缺點是由于進行了模糊處理而需要一些填充率。
下面是不同階段的效果比較圖:
謝謝你閱讀這篇文章,如有疑問歡迎來信anidex@yahoo.com. (這是原作者的信箱)
(汗,好多東西心里明白,但翻譯出來就是不滿意。各位要是看不明白就找出原文研究吧。)
- Hardware Shadow Mapping. Cass Everitt, Ashu Rege and Cem Cebenoyan.
- Hardware-accelerated Rendering of Antialiased Shadows with Shadow Maps. Stefan Brabec and Hans-Peter Seidel.