注:翻譯只求意思準(zhǔn)確,省略了一些不太相關(guān)的內(nèi)容,如有錯(cuò)誤煩請(qǐng)指正,原文:http://developer.download.nvidia.com/whitepapers/2007/SDK10/VarianceShadowMapping.pdf
Variance Shadow Mapping
Author:Kevin Myers kmyers@nvidia.com
譯:清風(fēng) http://www.shnenglu.com/zzxhang/
Motivation:
在Dx10級(jí)別的硬件下VSM能被完美支持,如果不能對(duì)fp32紋理過濾,算法就只能在fp16精度下完成,這是不夠的,會(huì)讓計(jì)算在數(shù)值上變得不穩(wěn)定,此外當(dāng)渲染陰影圖時(shí)還可以打開multisample anti-aliasing(MSAA)改善生成的陰影圖質(zhì)量
How Does It Work?
Shadow maps首先在光源視角上把場(chǎng)景的深度信息渲染到一張紋理中去。完成后這張紋理就包含了所有最靠近光源的像素片段。之后渲染場(chǎng)景時(shí)我們就可以查詢這張紋理用于判斷當(dāng)前進(jìn)行著色的像素片段是不是被陰影圖上的像素片段遮擋了。通過Percentage-closer filtering(PCF)進(jìn)行一定數(shù)量的紋理查詢可以得到軟陰影。
PFC的問題在于沒有一個(gè)好的方法能對(duì)深度值進(jìn)行預(yù)采樣,如果你武斷地對(duì)深度圖進(jìn)行一些特定的采樣方法,如anisotropic filtering或者mip-mapping,那么你得到的深度值就不是一個(gè)正確的遮擋值,而是好幾個(gè)可能的遮擋值的平均值,用這個(gè)值來進(jìn)行判斷就會(huì)造成圖像失真。
Summary of the Algorithm:
你可以在由William Donnelly 和 Andrew Lauritzen完成的最原始的VSM論文http://www.punkuser.net/vsm/中看到細(xì)致的算法理論闡述。
簡(jiǎn)單地說,VSM的作者在研究中進(jìn)行PCF得到的是在PCF采樣區(qū)域中深度值大于我們當(dāng)前渲染像素深度的像素的百分比的一個(gè)邊界值,換句話說我們?cè)谀靡粋€(gè)單獨(dú)的深度值和采樣區(qū)域的整體分布進(jìn)行比較,我們想知道的是在這個(gè)區(qū)域中有多少百分比的深度值是大于這個(gè)單獨(dú)的深度值的,我們只關(guān)心采樣區(qū)域深度分布的百分率而不是單獨(dú)的采樣值,通過切比雪夫不等式,我們能用平均值(或者說期望E(x))和分布的方差求出這個(gè)百分比的邊界值。
平均值是很容易通過深度圖得到的,我們可以通過mip-mapping或者separable blur在shader中過濾得到,方差也一樣很簡(jiǎn)單,通過平均值E(x)和平方的平均值E(x2)就能算出來:
就象我們之前說的那樣,平均值是很容易得到的,而平方的平均值我們可以只需要把深度圖的格式改為雙通道紋理并把深度的平均值渲染進(jìn)第二個(gè)通道。在照亮場(chǎng)景前我們?nèi)匀豢梢噪S意進(jìn)行一些過濾,之后簡(jiǎn)單的一次紋理查詢就可以計(jì)算出平均值和方差。
VSM Shader:
這是在DrawScene.fx的shader代碼:






























首先注意最后的max語句,如果當(dāng)前片段的深度值小于或者等于平均深度值,即t<=E(x),那么方程1已經(jīng)不適用了,圖2展示了如果我們不做t >= E(x)的限制從切比雪夫方程中得到的結(jié)果,注意在場(chǎng)景中模糊區(qū)域是怎樣從被照亮區(qū)域到陰影區(qū)域的,如果你對(duì)此有困惑,先想想導(dǎo)致方差改變的因素是什么,分布區(qū)域包含值域的范圍越廣,方差的值就越大,深度值范圍的劇烈變化(如輪廓區(qū)域)會(huì)使得方差的值變得比較大,在圖3中你能更清楚地看到這一點(diǎn),輪廓區(qū)域是方差迅速增加的地方,回頭看我們的方程這些區(qū)域會(huì)使得我們方程的結(jié)果趨向于1,在輪廓的另一邊方差會(huì)迅速減少,此時(shí)影響方程值繼續(xù)增大的因素就是另一個(gè)變量了(t – E(x)),在圖4中這個(gè)變量的值用綠色來形象化顯示,注意跟陰影區(qū)域相反的顏色變化是怎么發(fā)生的,當(dāng)靠近輪廓邊緣時(shí)采樣的深度值越來越接近像素片段深度值,(t – E(x))迅速減少。
Performance:
當(dāng)加上separable blur后VSM的效果真的很炫,這是用1024x1024的VSM在GeForce 8800 GTX上用1024 x 768的分辨率跑例子程序的結(jié)果:
Integration:
把已經(jīng)在用shadow map的程序改成用VSM還是比較簡(jiǎn)單的,首先深度圖必須變?yōu)镽
當(dāng)深度復(fù)雜性很高的時(shí)候VSM存在光照溢出(light bleeding)的錯(cuò)誤,最初的VSM論文中證明了當(dāng)遮擋體和接收體都比較平坦的時(shí)候VSM算法能計(jì)算得很正確,但如果情況不是那樣,劇烈的方差變化可能會(huì)導(dǎo)致方程返回一個(gè)錯(cuò)誤的結(jié)果,照亮了不該照亮的地方。
精度也是一個(gè)需要控制的問題,就算使用fp32的精度仍然可能不夠因?yàn)槲覀円尜A深度的平方值,在例子程序你可以通過改變光源距離(滑塊控制)看到這個(gè)問題,當(dāng)光源距離增加時(shí)遮擋體的深度值也越來越大,然后我們深度值的平方很快就遇到了精度問題。通過改變深度值的縮放值能一定程度上減輕這個(gè)問題,實(shí)際上在大多數(shù)場(chǎng)景中都可以通過把光源視錐體的大小限制在一定范圍內(nèi)控制這個(gè)問題。
由于在VSM中處理的是Z值的分布而不是一個(gè)簡(jiǎn)單的深度測(cè)試,因此VSM的一個(gè)改進(jìn)是不再需要z-offset來避免Z值過于靠近而產(chǎn)生的Z-fighting問題(譯者:但是仍然需要一個(gè)varance-offset…)
譯者: 本人把dx sample中的shadow map改成了使用VSM,1024 X 1024的shadow map,3 x 3 PCF,下面是VSM版和原版的效果圖對(duì)比(為了突出陰影做了些改動(dòng)):
dx sample:
vsm: