摘要
受管貼圖(Managed textures,也就是我們通常所謂的“自動(dòng)管理貼圖”),在DX6中首次被引入,經(jīng)過(guò)一系列的改進(jìn)和增強(qiáng),在DX9中自動(dòng)管理的資源類(lèi)型增加到貼圖,頂點(diǎn)緩沖,頂點(diǎn)索引緩沖,所有這些資源使用統(tǒng)一的公共接口。通過(guò)使用D3D資源管理器,應(yīng)用程序可以輕松的處理設(shè)備丟失、處理稍微過(guò)量的顯存使用。
有時(shí)開(kāi)發(fā)者在使用受管資源會(huì)遇到一些困難,這部分歸咎與系統(tǒng)的抽象特性。在大多數(shù)情況下使用受管對(duì)象是不錯(cuò)的選擇,但有時(shí)出于性能考慮也會(huì)使用非托管資源。這篇文章將討論一般情況下如何處理資源,受管與非受管資源的行為差別。
內(nèi)容
l 顯示內(nèi)存
l 受管資源
l 驅(qū)動(dòng)管制資源
l 默認(rèn)資源
l 系統(tǒng)內(nèi)存資源
l 一般性的建議
顯示內(nèi)存
為了使得資源可以利用顯存,GPU需要通過(guò)內(nèi)存訪問(wèn)定位他。GPU訪問(wèn)(Local video memory)顯存是非常高效的,并且某些資源(例如RenderTarget,深度、模板緩沖)必須在本地顯存(Local video memory)定位。由于AGP的出現(xiàn),GPU可以直接訪問(wèn)部分系統(tǒng)內(nèi)存,而這部分系統(tǒng)內(nèi)存區(qū)域就是所謂的非本地顯存(non-local video memory),當(dāng)然這部分內(nèi)存(顯存)也是不能挪做它用的。非本地顯存僅能被GPU訪問(wèn),與訪問(wèn)本地顯存相比,其效率低一些。需要明確的是,所有AGP內(nèi)存在設(shè)備丟失時(shí)都會(huì)失效,都需要在恢復(fù)他們。
一些集成顯卡使用統(tǒng)一內(nèi)存結(jié)構(gòu)(Unified Memory Architecture),這樣主內(nèi)存可以被系統(tǒng)任何一個(gè)設(shè)備尋址。D3D支持UMA而不需要修改任何代碼,這樣我們把系統(tǒng)內(nèi)存配置為本地顯存,硬件確保資源的定位就像傳統(tǒng)的結(jié)構(gòu)一樣進(jìn)行工作。
受管資源
大部分資源應(yīng)該使用POOL_MANAGED方式創(chuàng)建,即受管資源。所有受管資源將被創(chuàng)建在系統(tǒng)內(nèi)存,在需要的時(shí)候復(fù)制到顯存。當(dāng)發(fā)生設(shè)備丟失時(shí)會(huì)自動(dòng)copy系統(tǒng)內(nèi)存到顯存。既然不是所有受管資源都需要一次送入顯存,這樣你可以提交超過(guò)渲染每幀所必須使用的最小內(nèi)存容量,但是這樣會(huì)使得大量顯存內(nèi)容因?yàn)榉?span id="njhuhqz" class="GramE">頁(yè)操作而寫(xiě)到磁盤(pán)上,這是非常耗時(shí)的。這也是為什么恢復(fù)設(shè)備如此耗時(shí),因?yàn)樾枰獙⒋罅看疟P(pán)數(shù)據(jù)復(fù)制到顯存。
DX會(huì)為每份資源在最后一次使用時(shí)加上時(shí)間戳,這樣當(dāng)顯存分配失敗時(shí),它會(huì)釋放那些最近最少使用的資源(LRU算法)。使用SetPriority函數(shù)可以標(biāo)記資源的重要程度,重要的資源優(yōu)于時(shí)間戳的判斷,所以那些比較常用的資源應(yīng)該設(shè)置高優(yōu)先級(jí),而不用擔(dān)心因?yàn)闀r(shí)間戳過(guò)期而導(dǎo)致資源被釋放。在DX9中,驅(qū)動(dòng)程序提供的顯存管理信息是非常有限的,運(yùn)行時(shí)可能不得不清除大量資源用于分配足夠的內(nèi)存。設(shè)置適合的優(yōu)先級(jí)是非常有用的,這樣D3D不會(huì)清除那些馬上又需要使用的資源。應(yīng)用程序可以強(qiáng)制調(diào)用EvictManagedResources清除所有受管資源,但是如果下一幀又需要重新加載這些資源,這將是非常耗時(shí)的,不過(guò)這個(gè)函數(shù)在那些場(chǎng)景明顯需要改變(比如進(jìn)入下一個(gè)關(guān)卡)的情況下,還是非常有用的。
如果“當(dāng)前幀”內(nèi)需要非常多資源用于渲染,這將是件麻煩的事情,用前面的LRU方式調(diào)度資源效率就不太理想了,這個(gè)時(shí)候使用MRU資源調(diào)度方式取代,即優(yōu)先清理那些比較活躍的資源。注意,這里“當(dāng)前幀”的概念是指BeginScene和EndScene之間的需要渲染的幀。
開(kāi)發(fā)人員如果想得到關(guān)于受管資源的更多信息,可以通過(guò)IDirect3DQuery9接口查詢(xún),但是這個(gè)接口僅能用于調(diào)試模式(debug runtimes),在發(fā)布版本中,應(yīng)用程序不能依靠改接口的信息做任何假定。
了解資源管理如何工作可以幫助我們調(diào)試、調(diào)整程序,重要的是應(yīng)用程序不要太過(guò)依賴(lài)當(dāng)前的運(yùn)行庫(kù)(或者驅(qū)動(dòng)程序)的資源管理方式,驅(qū)動(dòng)更新有可能導(dǎo)致其行為發(fā)生變化,將來(lái)的D3D將會(huì)有套久經(jīng)考驗(yàn)的資源管理方式。
驅(qū)動(dòng)程序管理的資源
D3D驅(qū)動(dòng)可以自由的實(shí)現(xiàn)“由驅(qū)動(dòng)管理貼圖”的特性,通過(guò)D3DCAPS2_CANMANAGERESOURCE段可以查詢(xún)硬件驅(qū)動(dòng)是否支持這個(gè)特性,這樣驅(qū)動(dòng)將代替D3D運(yùn)行庫(kù)管理資源。對(duì)于級(jí)少數(shù)的硬件是支持這個(gè)特性的,對(duì)于大多數(shù)硬件則不盡相同,你可以咨詢(xún)你的產(chǎn)品提供商獲得這方面信息。一般情況下,你可是使用D3DCREATE_DISABLE_DRIVER_MANAGEMENT方式創(chuàng)建設(shè)備,這樣將由D3D運(yùn)行庫(kù)來(lái)管理資源。
缺省資源管理(非受管資源)
雖然受管資源非常簡(jiǎn)單,容易使用,高效,但是有時(shí)我們希望直接往顯存里寫(xiě)東西,這種情況下我們需要使用POOL_DEFAULT方式創(chuàng)建資源。使用這種方式會(huì)增加程序的復(fù)雜性,代碼需要應(yīng)付所有設(shè)備丟失的情況,并需要謹(jǐn)慎考慮何時(shí)復(fù)制數(shù)據(jù)到顯存。錯(cuò)誤的指定USAGE_WRITEONLY標(biāo)記或者鎖定渲染目標(biāo)(Render Target)將嚴(yán)重影響性能。
鎖定POOL_DEFAULT類(lèi)型的資源很可能導(dǎo)致GPU停止運(yùn)轉(zhuǎn),這與POOL_MANAGED類(lèi)型的資源是不同的,除非使用一些特性的指示標(biāo)記。根據(jù)資源當(dāng)前的位置不同,鎖定后得到的指針也不相同,可能是一塊臨時(shí)的系統(tǒng)內(nèi)存,也可能直接指向AGP內(nèi)存。如果是臨時(shí)的系統(tǒng)內(nèi)存,Unlock后將把這段數(shù)據(jù)送入顯存,這是因?yàn)槿绻@卡資源不是只寫(xiě)的(write-only),Lock的時(shí)候數(shù)據(jù)將不得不被送入一段臨時(shí)的內(nèi)存;如果指向的AGP內(nèi)存區(qū)域,臨時(shí)的拷貝是可以避免的,但是cache的行為將會(huì)降低性能。
為了避免在寫(xiě)入一整行數(shù)據(jù)(a full cache line of data)進(jìn)入AGP內(nèi)存區(qū)導(dǎo)致write-combing性能下降(一般是由于發(fā)生了一次讀寫(xiě)周期),順序的訪問(wèn)AGP內(nèi)存是推薦的做法,如果你的程序需要隨機(jī)的訪問(wèn)AGP內(nèi)存,而你又不希望使用受管資源,那么你可以使用系統(tǒng)內(nèi)存作為替代方案,這樣當(dāng)你生成了數(shù)據(jù)之后,可以lock后拷貝,這樣不會(huì)帶來(lái)太大的性能損失,這里的性能損失一般是由緩沖的“寫(xiě)搜索”操作引起。(注,這里關(guān)于詞匯cache write-combing譯者也不知道對(duì)應(yīng)的中文含義,只能按照字面意思翻譯,見(jiàn)諒)
對(duì)于某些類(lèi)型的資源,使用LOCK_NOOVERWRITE標(biāo)記會(huì)使添加數(shù)據(jù)比較有效率,但是多次的Lock,Unlock同一資源還是需要盡量避免的,適當(dāng)?shù)睦枚喾N不同的鎖定標(biāo)記對(duì)于效率優(yōu)化使非常重要的,就像填充鎖定內(nèi)存區(qū)域最好使用cache友好的(cache-friendly)數(shù)據(jù)訪問(wèn)方式一樣。
受管資源和缺省資源混合使用
受管資源與非受管資源的混合分配使用可能導(dǎo)致顯存碎塊,并且擾亂受管資源使用的內(nèi)存區(qū)域。最好在使用受管資源前使用非受管資源,或者使用受管資源后使用EvictManagedResources函數(shù)清除那些受管資源再使用非受管資源。記住,所有非受管資源都會(huì)常駐顯存,這樣其他內(nèi)存需求就不能使用了。
注意,與以往的DX版本不同,在顯存缺乏時(shí),如果分配非受管資源失敗,DX9會(huì)自動(dòng)清除受管資源,這有可能導(dǎo)致潛在的顯存碎塊,甚至把資源放入不適當(dāng)?shù)牡胤剑ū热绶潜镜貎?nèi)存的靜態(tài)貼圖區(qū))。所以,最好在使用受管資源之前分配全部的非受管資源。
動(dòng)態(tài)缺省資源
如果數(shù)據(jù)需要很高頻率更新,那最好使用非受管資源,并使用USAGE_DYNAMIC標(biāo)記,這樣驅(qū)動(dòng)會(huì)決定最適合的地方放置這些需要經(jīng)常更新的數(shù)據(jù)。這通常意味著放置在非本地顯存中,這樣對(duì)于GPU來(lái)說(shuō),訪問(wèn)速度可能相對(duì)要慢一些。而對(duì)于UMA架構(gòu),驅(qū)動(dòng)將會(huì)選擇CPU訪問(wèn)效率較高的特殊地方放置這些數(shù)據(jù)。
這種用法(動(dòng)態(tài)缺省資源類(lèi)型)一般用于軟蒙皮和基于CPU計(jì)算的粒子系統(tǒng)的頂點(diǎn)/頂點(diǎn)索引的Buffer填充,LOCK_DISCARD標(biāo)記可以保證資源仍被使用的時(shí)候,鎖定操作不會(huì)導(dǎo)致系統(tǒng)停止暫停工作。在這種情況下,使用受管資源會(huì)更新系統(tǒng)內(nèi)存,然后拷貝到顯存。對(duì)于系統(tǒng)的非本地內(nèi)存,多余拷貝是不需要的。
標(biāo)準(zhǔn)的貼圖是不允許鎖定的,僅僅可以通過(guò)UpdateSurface和UpdateTexture函數(shù)更新。一些系統(tǒng)支持動(dòng)態(tài)貼圖,它可以通過(guò)配合使用LOCK_DISCARD標(biāo)記進(jìn)行鎖定,但這需要檢查D3DCAPS2_DYNAMICTEXTURES硬件能力。對(duì)于高動(dòng)態(tài)貼圖(如視頻、程序生成貼圖),最好使用非受管資源和系統(tǒng)內(nèi)存資源,并且通過(guò)UpdateTexture函數(shù)更新貼圖。對(duì)于高頻度的粒子更新,UpdateTexture函數(shù)可能是最好的選擇。
在有限的總線-內(nèi)存帶寬下,靜態(tài)貼圖資源應(yīng)該使用POOL_MANAGED方式,這樣可以確保它最好的利用本地顯存,并有較好的效率。對(duì)于“半靜態(tài)”資源,使用動(dòng)態(tài)類(lèi)型資源有時(shí)會(huì)獲得更好的效率。
系統(tǒng)內(nèi)存資源
資源可以使用POOL_SYSTEMMEM方式創(chuàng)建。但他們不能用于圖形管線,他們僅能做為源數(shù)據(jù)用于更新POOL_DEFAULT類(lèi)型的資源,這是通過(guò)UpdateSurface和UpdateTexture函數(shù)完成的。他們的鎖定操作也非常簡(jiǎn)單,盡管他們同樣可能因?yàn)榍懊嫣岬降脑驅(qū)е孪到y(tǒng)停止運(yùn)轉(zhuǎn)。
雖然是在系統(tǒng)內(nèi)存中創(chuàng)建資源,但POOL_SYSTEMMEM所支持的資源格式和能力(比如最大尺寸)是受硬件、驅(qū)動(dòng)限制的。同樣是在系統(tǒng)內(nèi)存中創(chuàng)建資源的POOL_SCRATCH則沒(méi)有這方面限制,它支持所有格式和能力,但設(shè)備卻不能直接訪問(wèn)它。SCRATCH類(lèi)型資源一般用于內(nèi)容創(chuàng)建工具。
一般性的建議
了解資源管理的技術(shù)實(shí)現(xiàn)細(xì)節(jié)對(duì)達(dá)成你的程序的性能目標(biāo)是有非常大的幫助的,規(guī)劃你的資源如何交給D3D并設(shè)計(jì)好的結(jié)構(gòu)以便能及時(shí)加載必要的數(shù)據(jù)是一件非常復(fù)雜的工作,為此我們給出一些好的實(shí)踐經(jīng)驗(yàn)做為一般性的原則:
l 預(yù)處理你的資源。不要將耗時(shí)的加載資源、資源轉(zhuǎn)換、資源優(yōu)化丟給用戶(hù)去做,雖然這樣便于開(kāi)發(fā),但確讓用戶(hù)無(wú)法忍受。預(yù)處理這些資源可以加快加載,更快使用,你的用戶(hù)也會(huì)發(fā)現(xiàn)你的程序跑的更快了。
l 避免在每幀創(chuàng)建過(guò)多的資源。對(duì)于過(guò)多的資源加載,可以把他們分到多幀里完成或者不要急于釋放那些暫時(shí)不用的資源。
l 確保在一幀結(jié)束時(shí)已經(jīng)斷開(kāi)了所有資源通道。(比如,頂點(diǎn)流,texture stages,頂點(diǎn)索引)。
l 對(duì)于貼圖,建議使用壓縮貼圖(DXTn)格式,建議使用mip-map或者將小貼圖拼接為大貼圖使用。
l 建議使用頂點(diǎn)索引,這將減少數(shù)據(jù)傳輸量。
l 對(duì)于過(guò)渡的優(yōu)化資源管理是需要謹(jǐn)慎的。如果你的程序過(guò)分依賴(lài)驅(qū)動(dòng)、硬件和操作系統(tǒng)的某些特征,那么這些程序、硬件的修改將會(huì)導(dǎo)致潛在的性能問(wèn)題。