寫(xiě)3d圖形程序,就一定會(huì)做坐標(biāo)變換。而談到坐標(biāo)變換,就不得不提起投影變換,因?yàn)樗撬凶儞Q中最不容易弄懂的。但有趣的是,各種關(guān)于透視變換的文檔卻依然是簡(jiǎn)之又簡(jiǎn),甚至還有前后矛盾的地方。看來(lái)如此這般光景,想要弄清楚它,非得自己動(dòng)手不可了。所以在下面的文章里,作者嘗試推導(dǎo)一遍這個(gè)難纏的透視變換,然后把它套用到 DX和 PS2lib 的實(shí)例中去。
-
一般概念
所謂透視投影變換,就是view 空間到project 空間的帶透視性質(zhì)的坐標(biāo)變換步驟(這兩
個(gè)空間的定義可以參考其他文檔和書(shū)籍)。我們首先來(lái)考慮它應(yīng)該具有那些變換性質(zhì)。很顯然,它至少要保證我們?cè)趘iew空間中所有處于可視范圍內(nèi)的點(diǎn)通過(guò)變換之后,統(tǒng)統(tǒng)落在project空間的可視區(qū)域內(nèi)。好極了,我們就從這里著手——先來(lái)看看兩個(gè)空間的可視區(qū)域。
由于是透視變換,view空間中的可見(jiàn)范圍既是常說(shuō)的視平截體(view frustum)。如圖,
(圖1)
它就是由前后兩個(gè)截面截成的這個(gè)棱臺(tái)。
從view空間的x正半軸看過(guò)去是下圖這個(gè)樣子。
(圖2)
接下來(lái)是project空間的可視范圍。這個(gè)空間應(yīng)當(dāng)是處于你所見(jiàn)到的屏幕上。實(shí)際上將屏幕表面視作project空間的xoy平面,再加一條垂直屏幕向里(或向外)的z軸(這取決于你的坐標(biāo)系是左手系還是右手系),這樣就構(gòu)成了我們想要的坐標(biāo)系。好了,現(xiàn)在我們可以用視口(view port)的大小來(lái)描述這個(gè)可視范圍了。比如說(shuō)全屏幕640*480的分辨率,原點(diǎn)在屏幕中心,那我們得到的可視區(qū)域?yàn)橐粋€(gè)長(zhǎng)方體,它如下圖(a)所示。

(圖3)
但是,這樣會(huì)帶來(lái)一些設(shè)備相關(guān)性而分散我們的注意力,所以不妨先向DirectX文檔學(xué)學(xué),將project空間的可視范圍定義為x∈[-1,1], y∈[-1,1], z∈[0,1]的一個(gè)立方體(上圖b)。這實(shí)際上可看作一個(gè)中間坐標(biāo)系,從這個(gè)坐標(biāo)系到上面我們由視口得出的坐標(biāo)系,只需要對(duì)三個(gè)軸向做一些放縮和平移操作即可。另外,這個(gè)project坐標(biāo)系對(duì)clip操作來(lái)說(shuō),也是比較方便的。
-
推導(dǎo)過(guò)程
先從project空間的x正半軸看看我們的變換目標(biāo)。
(圖4)
這個(gè)區(qū)域的上下邊界為y’=±1, 而圖2中的上下邊界為y = ± z * tan(fov/2),要實(shí)現(xiàn)圖
2到圖4的變換,我們有y’ = y * cot(fov/2) / z。這下完了,這是一個(gè)非線性變換,怎么用矩陣計(jì)算來(lái)完成呢?還好我們有w這個(gè)分量。注意到我們?cè)谧鐾队白儞Q之前所進(jìn)行的兩次坐標(biāo)變換——world變換和view變換,他們只是一系列旋轉(zhuǎn)平移和縮放變換的疊加。仔細(xì)觀察這些變換矩陣,你會(huì)發(fā)現(xiàn)它們其實(shí)不會(huì)影響向量的w分量。換句話說(shuō),只要不是故意,一個(gè)w分量等于1的向量,再來(lái)到投影變換之前他的w分量仍舊等于1。好的,接下來(lái)我們讓w’= w*z, 新的w就記錄下了view空間中的z值。同時(shí)在y分量上我們退而求其次,只要做到y(tǒng)’ = y * cot(fov/2)。那么,在做完線性變換之后,我們?cè)儆孟蛄康膟除以w,就得到了我們想要的最終的y值。
x分量的變換可以如法炮制,只是fov要換一換。事實(shí)上,很多用以生成投影變換矩陣的函數(shù)都使用了aspect這個(gè)參數(shù)。這個(gè)參數(shù)給出了視平截體截面的縱橫比(這個(gè)比值應(yīng)與view port的縱橫比相等,否則變換結(jié)果會(huì)失真)。如果我們按照慣例,定義aspect = size of X / size of Y。那么我們就可以繼續(xù)使用同一個(gè)fov而給出x分量的變換規(guī)則:x’ = x * cot(fov/2) / aspect。
現(xiàn)在只剩下z分量了。我們所渴望的變換應(yīng)將z = Znear 變換到z = 0,將z = Zfar變換到z = 1。這個(gè)很簡(jiǎn)單,但是等等,x, y最后還要除以w,你z怎能例外。既然也要除,那么z = Zfar 就不能映射到z = 1了。唔,先映射到z = Zfar試試。于是,有z’ = Zfar*(z-Znear)/(Zfar – Znear)。接下來(lái),看看z’/z的性質(zhì)。令f(z) = z’/z = Zfar*(z-Znear)/(z*(Zfar – Znear))。
則f’(z) = Zfar * Znear / ( z^2 * (Zfar –Znear )), 顯而易見(jiàn)f’(z) > 0。所以除了z = 0是一個(gè)奇點(diǎn),函數(shù)f(z)是一個(gè)單調(diào)增的函數(shù)。因此,當(dāng)Znear≤z≤Zfar時(shí),f(Znear)≤f(z)≤f(Zfar),
即0≤f(z)≤1。
至此,我們可以給出投影變換的表達(dá)式了。
x’ = x*cot(fov/2)/aspect
y’ = y*cot(fov/2)
z’ = z*Zfar / ( Zfar – Znear ) – Zfar*Znear / ( Zfar – Znear )
w’ = z
以矩陣表示,則得到變換矩陣如下,
cot(fov/2)/aspect 0 0 0
0 cot(fov/2) 0 0
0 0 Zfar/(Zfar-Znear) 1
0 0 -Zfar*Znear/(Zfar-Znear) 0。
做完線性變換之后,再進(jìn)行所謂的“歸一化”,即用w分量去除結(jié)果向量。
現(xiàn)在我們考慮一下這個(gè)變換對(duì)全view空間的點(diǎn)的作用。首先是x和y分量,明了地,當(dāng)z>0時(shí),一切都如我們所愿;當(dāng)z<0時(shí),x和y的符號(hào)在變換前后發(fā)生了變化,從圖象上來(lái)說(shuō),view空間中處于camera后面的圖形經(jīng)過(guò)變換之后上下顛倒,左右交換;當(dāng)z= 0 時(shí),我們得到的結(jié)果是無(wú)窮大。這個(gè)結(jié)果在實(shí)際中是沒(méi)有意義的,以后我們得想辦法弄掉它。再來(lái)看z,
仍舊拿我們上面定義的f(z)函數(shù)來(lái)看,我們已經(jīng)知道當(dāng)z≥Zfar時(shí),f(z)≥1;同時(shí)當(dāng)z→+∞,f(z)→Zfar/(Zfar-Znear);當(dāng)z→+0時(shí),f(z)→-∞; z→-0時(shí),f(z)→+∞; z→∞時(shí),f(z)→Zfar/(Zfar-Znear).由此我們畫(huà)出f(z)的圖像。
(圖5)
由此圖可以看出當(dāng)z≤0時(shí),如果我們?nèi)耘f使用f(z)進(jìn)行繪制會(huì)產(chǎn)生錯(cuò)誤。所以我們會(huì)想需要clip操作——只要這個(gè)三角形有任意一個(gè)頂點(diǎn)經(jīng)過(guò)變換后z值落在[Zfar/(Zfar-Znear), +∞]區(qū)間中,我們就毫不憐憫地拋棄她——因?yàn)闊o(wú)論如何,這個(gè)結(jié)果是錯(cuò)的。那么萬(wàn)一有三角形在view空間內(nèi)橫跨了Znear到0的范圍,按我們想應(yīng)該是畫(huà)不出來(lái)了。但是回想一下我們所看見(jiàn)過(guò)的DirectX程序,似乎從未看到過(guò)這種情況。有點(diǎn)奇怪,但是不得不先放放,稍后再說(shuō)。
3.到DirectX中求證
在DirectX中拿一個(gè)用fov生成投影矩陣的函數(shù)來(lái)看。
D3DXMATRIX* D3DXMatrixPerspectiveFovLH( D3DXMATRIX* pOut, FLOAT fovy, FLOAT Aspect,
FLOAT zn, FLOAT zf )
這個(gè)函數(shù)恰好使用了我們剛才推導(dǎo)所使用的幾個(gè)參數(shù),經(jīng)過(guò)一些數(shù)據(jù)的代入計(jì)算之后,我們就會(huì)發(fā)現(xiàn)它所產(chǎn)生的矩陣就是我們計(jì)算出來(lái)的。看來(lái),DirectX的思路和我們是一致的。好的,一個(gè)問(wèn)題解決了,但一個(gè)新的問(wèn)題接著產(chǎn)生——DirectX是怎么做clip的?我不知道,而且看樣子現(xiàn)在也知道不了,只能期待牛人相助或者是碰到一本好書(shū)了。
4.研究ps2lib的投影變換
其實(shí)投影變換都是一回事,但是PS2lib的函數(shù)怎么有點(diǎn)不一樣呢?仔細(xì)看看,原來(lái)我們的思路是先做“歸一化”,然后再做view port的放縮和平移,而PS2不是這樣——它把“歸一化”放在最后。接下來(lái),我們就按這個(gè)順序試試。
先看縮放操作,把它和除z交換順序很方便,直接換便是了。于是我們記view port 的寬度為Vw,高度為Vh, Z緩存的最大值為Zmax, 最小值為Zmin則有
x’ = x * cot(fov/2)/aspect*(Vw/2)
y’ = y * cot(fov/2)*(Vh/2)
z’ = Zfar(z-Znear)/(Zfar-Znear) * (Zmax-Zmin);
w’ = z
再看平移部分,既然是要平移后再除,則必須平移原來(lái)的z倍,于是我們又記view port中心坐標(biāo)為(Cx, Cy),就有
x’’ = x’ + z * Cx
y’’ = y’ + z * Cy
z’’ = z’ + z * Zmin
w’’ = w
好的,我們看看cot(fov/2)等于什么,從圖2看,實(shí)際上它就是D/(Vh/2),那么cot(fov/2)/aspect實(shí)際上就是D/(Vw/2)。但是,ps2在這上面耍了個(gè)小花招,它在view空間中的view port和project空間的view port可以不相等。最明顯的一點(diǎn)是,它在view空間中的view port的高度為480,但實(shí)際上它的輸出的y向分辨率只有224。也就是說(shuō),ps2想要輸出縱橫比等于電視機(jī)的圖像,就必須在y向上再加一個(gè)縮放。這個(gè)縮放在我們的變換中體現(xiàn)在哪呢?就在y’ = D/(Vh/2) * (Vhscr/2)中,注意到兩個(gè)Vh不相等(project空間中的Vh記成Vhscr),兩個(gè)值一運(yùn)算就得到x’ = D*(224/480) = 0.466667D。這個(gè)0.4666667就是ps2lib函數(shù)參數(shù)ay的由來(lái)。同理,我們亦可得知ax一般應(yīng)取值為1。那么,實(shí)際上ps2lib函數(shù)的scrz,ax, ay三個(gè)參數(shù)的作用等同于DirectX的象形函數(shù)的fov和aspect,在確定的規(guī)則下,他們可以相互轉(zhuǎn)換,得到性質(zhì)完全相同的透視變換。至于這個(gè)規(guī)則,這里就不給出了。
轉(zhuǎn)回正題,有了上面的討論,我們就可以展開(kāi)我們的變換表達(dá)式如下,
x’’ = x * scrz * ax + z * Cx
y’’ = x * scrz * ay + z * Cy
z’’ = z * (Zfar*Zmax–Znear*Zmin)/(Zfar – Znear)
–Zfar*Znear*(Zmax-Zmin)/(Zfar-Znear)
w’’ = z
z分量好像還有點(diǎn)不一樣,注意到一般ps2程序在z buffer的操作為greater&equal,而DirectX的操作為less&equal,就是說(shuō),z方向得做些變動(dòng)——得把z=Znear映射到z’’ = Zmax,z=Zfar映射到z’’=Zmin。說(shuō)變就變,我們馬上有
z’ = Zfar(z-Znear)/(Zfar-Znear)*(Zmin-Zmax)
z’’ = z’+Zmax
再次展開(kāi),得到z’’ = z * (Zfar*Zmin–Znear*Zmax)/(Zfar – Znear )
+ Zfar*Znear*(Zmax-Zmin)/(Zfar-Znear)
好了,用矩陣把這個(gè)變換寫(xiě)出來(lái),
scrz*ax 0 0 0
0 scrz*ay 0 0
Cx Cy (Zfar*Zmin–Znear*Zmax)/(Zfar – Znear ) 1
0 0 Zfar*Znear*(Zmax-Zmin)/(Zfar-Znear) 0,
這下就完全一樣了。下面的任務(wù)就是看看這個(gè)變換的性質(zhì)。因?yàn)樽詈笸瑯右詚,所以x,y分量上的情形的和原來(lái)我們推導(dǎo)的DirectX的投影變換是一樣的,區(qū)別在z分量上。來(lái)看新的f(z)函數(shù),它的圖像為
(圖6)
5.結(jié)論
至此,我們已經(jīng)完成了預(yù)定的目標(biāo)。但是,將坐標(biāo)變換完全掌握之后,為了做一個(gè)像樣的圖形程序,我們還有更多事情要做——至少在PS2上是這樣?。
|