使用基于GPU的Geometry Clipmaps進行地形渲染
Terrain Rendering Using
GPU-Based Geometry Clipmaps
?
?
?
Arul Asirvatham
Microsoft Research
Hugues Hoppe
Microsoft Research
1?
Geometry Clipmap
簡介
本文系手工翻譯,因為最近比較忙,所以分成5篇來完成。翻譯的目的是為了促進算法的學習和改進,具體C++實現會集成到AthenaMTRE中,故不會放出源代碼。由于圖片暫時沒有找到合適的國內空間,如需要請查看原文內圖片http://research.microsoft.com/~hoppe/#geomclipmap,或http://liruzhan.blogspot.com/。有些地方翻譯得有些難懂,如覺得不明白,請留言或查看原文對比。Shader翻譯成著色器;Texture材質;Buffer緩存;grid指在地形技術中的正方形的網格,在這里和多邊形網格mesh不同義;Terrain地形;Landscape地貌;Clipmap暫時不翻譯,沒想好;finer level更加精細的層次;coarser level更加粗糙的層次。如有問題請留言。
?????? 2004
年,
Losasso
和
Hoppe
介紹了一種全新的用于地形渲染的
LOD
結構:
Geometry clipmap
。這種方法將地形的幾何形狀緩存在一組嵌套規則柵格
(nested regular grids)
里,這個嵌套柵格伴隨著視點的移動而被增量地推移。這種柵格結構提供了比以往的非規則網格
(Irregular Mesh)
技術更多的好處:數據結構的簡化,邊界的視覺平滑,平穩的渲染速率,優美的分解,高效的壓縮,以及實時的細節融合。在這一章,我們將描述一種基于
GPU
使用頂點材質
(Vertex Texture)
來實現的
Geometry Clipmap
算法。在將地形的幾何形狀作為一組圖象集合來處理的時候,我們能夠在
GPU
上實現幾乎所有的計算,以此來降低
CPU
負載。這種技術易于實現,并且能夠以大約
90
幀
/
秒的渲染速率,
355
兆的內存空間,交互式地飛過一個由
200
億采樣網格組成的美國地形模型。
1.1?
回顧
Geometry Clipmap
在大型室外場景中,地形外貌的幾何形狀會要求巨大的存儲空間和渲染帶寬。很多
LOD
技術被開發出來,使地形網格的三角化過程像一個視見函數一樣被適應。然而大多數這種技術需要實時地建立和修改網格結構(頂點和索引緩存),這在當前的顯示架構中會導致昂貴的開銷。而且不規則網格的使用通常需要
CPU
處理,在許多程序例如游戲中
CPU
資源已經是非常有限的了。
Geometry clipmap
框架(
Losasso
和
Hoppe
,
2004
)把地形作為一張
2
維高度圖來對待,
把它預先分解為一個多分辨率的
L
層金字塔(見圖
1
-
1
)。對于復雜的地形而言,一個完整的金字塔相對于內存而言太大了。
Geometry clipmap
結構在每一層里緩存了一個由
n
×
n
幾何采樣點構成的
正方形窗口,很像
1998
年
Tanner
的
texture clipmaps
。這些窗口與一系列中心位于視點的嵌套規則柵格相關聯(見圖
1
-
2
)。需要注意的是,更加精確的層次窗口(
finer-level windows
)的空間范圍比更加粗糙的層次窗口(
coarse-level windows
)小。這樣做的目的是為了在屏幕空間中保證一致的三角形大小。在一個
n = 255
的
Clipmap
中,位于分辨率
1024
×
768
窗口中的每個三角形大約
5
個象素寬。
?
只有最精細的層次被渲染為一個完整地柵格方塊。在所有其他層次中,我們只渲染一個空心的環,環的中心區域被忽略,因為它已經在更精細的層次中被渲染出來了。當視點移動時,Clipmap窗口被移動并更新數據。為了允許高效的增量更新,Clipmap窗口在每一個層次中與環面相關聯,這意味著2維環繞尋址(見1.4節)
?
對于clipmap結構的挑戰之一是,如何消除連續層次之間的邊界,這意味著同時維持網格的連續性和緊密性,以及防止暫時性的跳躍現象(popping)。Geometry clipmap的嵌套柵格結構提供了一個簡單的解決方案,在每一層次的外層邊界處設置一個過渡區域,在這個過渡區域里幾何形狀和材質被平滑地變形插值到下一個粗糙層次(見圖1-3)。這些過渡過程可以使用頂點和像素著色器(vertex and pixel shaders)來實現。
?
Geometry clipmap
的嵌套柵格結構也能夠實現高效的壓縮和合成。它允許對通過對上一個粗糙層次的數據的采樣來預測當前一層的高度數據。因此只需要存儲或合成附加到這個預測信號的剩余細節(或差值)。
?
1.2???
GPU
實現的簡介
在2004年Losasso和Hoppe的展示的Geometry Clipmap的原始算法中,每一個細節層次使用傳統的頂點緩存(vertex buffer)來實現。鑒于當時的GPU缺少修改頂點緩存的能力,那個原始算法需要CPU干涉clipmap的更新和渲染(見表1-1)。
?
在這一章里,我們介紹一種通過頂點材質(vertex texture)來實現geometry clipmaps的方法。這種方法的優勢在于,相對于將每一個clipmap窗口的2維柵格數據手動地線性化到一個1維頂點緩存里,這些2維柵格數據可以更自然地存儲在一個2維材質中。
需要重新指出,clipmap有L個層次,每個層次包含了一個
n
×
n
幾何采樣點的柵格。我們的目標是將采樣點的(
x
,
y
,
z
)幾何坐標分割成兩部分:
?
l???????
(x,y)坐標被當作常量的頂點數據存儲。
l???????
z
坐標被存儲在一個單通道2維材質中
à
高度圖。我們為每一個clipmap層次定義一個單獨的
n
×
n
高度圖材質。伴隨著視點運動,這些材質在
clipmap
層次被移動的時候被更新。
?
因為
clipmap
層次是統一的
2
維柵格,它們的(
x
,
y
)坐標是規則的,并且相對于位移和縮放而言是常數。因此我們定義了一組只讀的頂點和索引緩存用來
描述2維“足跡”(footprints),并且重復地在層次內和層次之間實例化這些足跡,這個過程將在1.3.2中介紹。
?
頂點通過從頂點材質里采樣來獲得z坐標。在頂點著色器里訪問一個材質是DirectX 9 Shader Model 3.0的一個新特性,并且被例如NVIDIA的Geforce 6系列的GPU支持。
?
將高度數據存儲在一組圖象中,可實現直接通過GPU的光柵流水線來操作。 對于合成地形的情況,所有實時計算(高度圖取樣,地形細節合成,向量圖計算以及渲染)全部在顯卡上被執行,從而保持CPU空閑。對于壓縮地形而言,CPU遞增地解壓縮和上傳數據到顯卡(見1.4節)。
1.2.1??
數據結構
總的來說,主要的數據結構在接下來介紹。我們預定義一小組常量頂點和索引緩存,用來對
clipmap
柵格的(
x
,
y
)幾何坐標進行編碼。并且對于每一個從
0
到
L-1
的層次,我們分配一張高度圖(一個單通道浮點
2
維材質)和一張法向量圖(一個
4
通道
8
位
2
維材質)。所有這些數據結構都存儲在顯卡內存里。
1.2.2??
Clipmap
尺寸
因為每一層次的外邊界必須位于下一個粗糙層次的柵格上(見圖
1
-
4
),柵格尺寸
n
必須是奇數。硬件可以根據材質尺寸進行
2
次冪優化,因此我們選擇
n
=
2
k
?
1
來保證材質中的
1
行和
1
列不被使用。大多數例子中我們使用
n
=
255
。
?
選擇
n
=
2
k
?
1
作為柵格尺寸有一個額外的好處:一個精細的層次永遠不會正好位于與它關聯的下一個粗糙層次的中心。換句話說,依賴于視點的位置,它們之間總是存在一個柵格單位的偏移(上下左右,見圖
1
-
4
)。事實上,當一個精細層次的關聯的下一個粗糙層次保持固定的時候,應該允許這個精細層次被移動,因此它有時候必須偏離與它關聯的下一個粗糙層次的中心。柵格尺寸的另外一個選擇是
n
= 2k
?
3
,這將提供精確置中的可能性,但是這仍然要求處理偏離中心的情況,而導致實現起來比前一種情況更加復雜。