不可不看!真正專業顯卡技術分析評測
轉自:http://www.enet.com.cn/article/2005/0617/A20050617425464.shtml
近年來圖形卡產品有了爆炸式的增長,專業圖形卡產品和娛樂圖形卡產品的界限越來越模糊。許多DIYer通過RivaTuner等工具輕易的修改 Geforce為Quadro、修改Radeon為FireGL。但是這樣的修改并沒有使得專業圖形卡的價格有所下降,專業圖形卡的價格依然幾倍于娛樂圖形卡。即便是Quadro和Geforce有如此親近的血緣關系,兩者的價格依然是天淵之別。
有DIYer認為將Geforce通過各種軟件修改為Quadro就能得到一張專業的圖形卡,這張修改來的圖形卡在OpenGL方面的表現的確有了明顯的提升。但這就是專用圖形卡的全部嗎?答案絕對是否定的。要弄清楚專業圖形卡和娛樂圖形卡的區別,我們首先需要了解專業圖形卡究竟能干些什么事情。
還有人認為如果擁有一片專業圖形卡,那在運行3ds Max、Maya、Softimage XSI等DCC類軟件時的速度將會大大提升、最終渲染時間也將極大縮短。但是當他們花了幾萬元買來一片專業圖形卡的時候,他們會發現這些軟件的最終渲染時間并沒有減少。事實上現階段專業圖形卡最大的作用依然是加快DCC類軟件的創作速度——無論是Quadro還是Wildcat,他們都著重于加速 Maya、Softimage XSI等軟件在建模、貼圖、光照時候的視口工作區(Viewport)預覽速度。面對復雜的場景時,往往拖動一下鼠標、畫一條直線都需要系統耗費大量時間來重新繪制預覽工作區,這樣整個創作過程就會變得極端低效。一旦你有了這些專業圖形卡,再次打開復雜的場景進行編輯修改時他們將會以實時的速度給你提供預覽,而不必冗長的等待。
既然專業圖形卡能加速DCC類軟件的預覽速度,為啥他們面對最終渲染時表現卻那么強差人意呢?這個問題的答案正在不斷變化。2001年時,幾乎所有的好萊塢特效/3D制作室都認為對最終渲染進行硬件加速的結果將是災難性的。這是因為當時的專業圖形卡的可編程能力非常弱,渲染出來的結果往往和預計有著明顯的差異。而到了今天,在新一輪統計中眾多的好萊塢工作室越來越多的在某些場景中使用硬件加速渲染。這幾年來隨著GPU可編程能力的不斷提升, GPU終于也能渲染出和CPU軟件渲染媲美的最終效果了,而前者的速度卻是后者的幾百倍甚至上萬倍。

根據標準衛星數據繪制的可視化模擬地圖
除了GPU可編程性能的提升外,各類3D軟件對于硬件的支持也越來越成熟。其中低端的3ds max在6.0內已經引入了DX9 Shader加速預覽Plug-in,到了3ds max7則將這個功能徹底加強。中端市場的Maya從5.0開始加入了對硬件加速預覽的支持,到了Maya 6.0時更是能夠提供多種硬件加速預覽、加速最終渲染的配置和方案。至于電影級3D軟件的王者Softimage XSI在3.0的時候對于硬件的支持已經非常領先了,在進化到4.0之后用硬件加速最終渲染的結果已經能和CPU Scanline軟件渲染相提并論。一旦OpenGL 2.0得到全面的應用,這些軟件對于硬件的支持將會更進一步。
GPU在進步、軟件在進步,但專業圖形卡在DCC類軟件中依然有著不可逾越的界限。熟悉3D DCC類軟件的朋友應該知道新版本的3D DCC軟件往往包含3種渲染技術,他們分別是最為古老的Scanline算法(掃描線算法)、Global Illumination(全局照明,包含Ray Trace,光線追蹤算法、Radiosity,光能傳遞或者叫做輻射度算法)和最新引入的硬件渲染。事實上硬件渲染也是基于Scanline的。(下頁將會有關于這些名詞的解析)
然而,在日常應用中GI的優勢已經越來越明顯,許多設計師也更傾向于使用GI類渲染器來完成他們的工作。由于Ray Trace算法和Radiosity算法包含大量的有限元分析計算和迭代,傳統的GPU對此毫無辦法,更遑論加速了。直到現在,用GPU加速GI類計算依然處于實驗室階段。在今年的SIGGRAPH 05中德國Sarrland大學展示了能夠實時加速GI類計算的硬件SaarCOR的可運行版本。其相關論文在2002年SIGGRAPH會議上已經發表,由此可見開發難度。

由4個FPGA組成的SaarCOR系統(圖中尚有2個FPGA空位)

由SaarCOR進行實時渲染的Quake3光線追蹤版引擎繪制的畫面(注意看水壺上的光線反射場景)
不要以為專業圖形卡就只能畫畫3D圖形,事實上他們的用處遠遠超過你的想象。現代科學研究中根本無法離開專業圖形卡的幫助,專業圖形卡能夠對可視化計算進行加速、能夠繪制衛星地圖、能夠繪制3D熱源分布圖甚至是進行模擬裝配和流體力學計算。通過一定的算法,專業圖形卡甚至還能加速聲音的可視化處理(這也是General Purpose GPU項目的研究目標)。我們熟悉的美軍M1A1坦克、F22戰斗機上就裝配有NVIDIA Quadro圖形芯片,配合Wind River實時操作系統進行衛星地圖的繪制和目標鎖定識別瞄準。

Quantum3D和美軍合作開發的地形匹配鎖定瞄準系統

Global Illumination / Ray Tracing / Radiosity
在前面介紹專業顯卡時,提到了Global Illumination、Ray Tracing等專業名詞,下面就對它們的含義作一些簡單的解釋。
什么是Global Illumination?

采用全局照明渲染器繪制的3D圖片(請注意本文所有示例圖片都為直接渲染而成)
Global Illumination(全局照明)是一個和Local Illumination(局部照明)相對的概念。絕大部分簡單的3D軟件都能提供Local Illumination的支持。但是Local Illumination在應用上有極大的局限。Local Illumination只考慮光源對目標物體的改變,而不去考慮該光源對其他對象的影響。而在Global Illumination中光線對于目標對象以外的影響將會被同時計算。現代的全局照明往往同時包含了光線追蹤渲染和輻射度渲染,渲染器用輻射度計算出全局與視圖無關的照明方案,然后Ray tracing使用這個方案渲染跟視圖相關的圖像并增加鏡像高光和反射。現階段應用最廣泛的Mental Ray、Final Render等渲染器都提供了對GI的支持。
什么是Ray Tracing?

我們將光源分成眾多的射線,然后再沿著視點和象素連線射出一條光線,之后根據材質的屬性計算出這些光線被物體吸收、折射、反射后最終回到視點中的數值變化,從而獲得一個正確光照場景。OpenGL ARB在2005年1月31日宣布,已經有研究組織成功的在Geforce6800 GT GPU上通過Cg和OpenGL API實現硬件光線追蹤計算。

用OpenGL API在Geforce6800 GT上實現硬件Raytrace

2002年Graphics Hardware會議上北卡羅萊納大學發表的光線追蹤GPU構想
什么是Radiosity?

LightWave 8中Radiosity渲染器所渲染出的圖片
Radiosity (輻射度渲染或光能傳遞) 算法其本質就是將光看作是一種物理輻射,然后計算輻射的傳導就能獲得加之于每個對象物體上的光照強度,從而獲得正確的渲染結果。輻射度渲染通過制定在場景中光線的來源并且根據物體的位置和反射情況來計算從觀察者到光源的整個路徑上的光影效果。在這條線路上,光線受到不同物體的相互影響,如:反射、吸收、折射等情況都被計算在內。和其他渲染方法相比,Radiosity更接近于光的自然傳播原理,因而受到廣泛的歡迎。

單純采用Radiosity算法進行的場景渲染
10年前專業圖形卡市場被幾家公司牢牢占據——3Dlabs、Evans & Sutherland、Quantum3D、Diamond。時過境遷,眾所周知Diamond已經在幾年前倒閉,旗下的FireGL圖形卡開發小組被賣給了ATi。3Dlabs被創新收購后一蹶不振,直到Wildcat Realizm系列圖形卡才挽回顏面。Evans & Sutherland、Quantum3D兩家則徹底退出專業圖形卡市場轉向可視化模擬領域,Evans & Sutherland美國軍方開發了MCT系統對飛行員進行可視化模擬培訓,Quantum3D則和NVIDIA合作為美國軍方開發了America Amry可視化模擬訓練系統。除了美國軍方之外,這兩家可視化模擬器產品也被眾多公司、機構所采用,兩家的產品幾乎壟斷了整個高端可視化模擬器市場。

Quantum3D的IDX2000可視化模擬器
在讓我們看看3Dlabs。作為OpenGL的起草人之一,3Dlabs和SGI合力搭建了整個3D世界的基石。因此在很長一段時間內, 3Dlabs的專業圖形卡有著極高的市場份額。與此同時3Dlabs的“半專業”圖形卡Premeida2在民用圖形卡市場獲得了不小的成功。可惜這次的成功使得3Dlabs開始狂妄了起來,Premedia3遲遲無法完成研發,周圍的對手卻在虎視耽耽,準備瓜分專業圖形卡市場。

E&S的飛行培訓可視化模擬器
NVIDIA Geforce256的誕生絕對是計算機圖形史劃時代的進步。T&L的引入一下子拉近了專業卡和民用卡之間的距離。以往專業卡上昂貴的獨立幾何處理單元被集成進了GPU內部,這樣民用圖形卡首次有了和專業圖形卡相提并論的機會。NVIDIA隨后伙同了ELSA共同推出了內核邏輯設計幾乎和 Geforce256完全相同的Quadro256 GPU。NVIDIA Quadro的成功和曾經輝煌的ELSA密不可分。在Quadro以前ELSA已經在專業市場上占據大量的份額,基于3Dlabs圖形芯片的ELSA GLoria系列圖形卡成為當時眾多DCC工作者夢寐以求的東西。

Quantum3D/NVIDIA和美國軍方聯手開發的戰地士兵訓練系統(也就是America Army游戲的專業版)
在Quadro之前,NVIDIA和ELSA試探性的推出基于RIVA TNT2的專業卡ELSA Synergy II圖形卡,該卡上市后成為當時性價比最高的產品。也為日后Quadro的成功打下了基礎。據稱當年ELSA的工程師們單就修改TNT2原始驅動中所存在的Bugs就多達3000多個,更不用說接下來的PCB重新設計及針對軟件的優化工作量了。NVIDIA推出Quadro大獲成功后不久,為了徹底完善專業圖形卡領域的驅動支持,將整個ELSA專業圖形卡驅動研發隊伍納入旗下,而ELSA在失去這支精銳隊伍之后開始一蹶不振。

第一片采用NVIDIA圖形芯片的專業圖形卡
當時還有另外一家公司于ELSA旗鼓相當,那就是Diamond。和ELSA不同,Diamond的專業圖形卡從設計到驅動研發是由旗下一個獨立的工作組完成的,該工作組就是FireGL。FireGL從SPEA公司轉到Diamond旗下后,無論是產品的推出速度還是產品的競爭力上都有了驚人的提升。在這段時期內,FireGL小組推出了FireGL 1000、FireGL 2000、FireGL 3000、FireGL 4000共4片圖形卡。有趣的是這4片圖形卡的圖形核心竟然來自于3家毫無關聯的公司。FireGL 1000采用了3Dlabs Premedia NT+GLint Delta核心,而FireGL 2000的圖形核心來自于AVANCE Logic。FireGL 3000同樣使用Premedia Avance。最后的FireGL 4000竟然選擇了三菱3D PRO 2MP圖形內核。
隨后因為臺灣廠商的加入,板卡制造行業的利潤急速下滑。Diamond和ELSA同時遇到經營危機,Diamond被S3收購后改名為 Sonic Blue,專門推出S3圖形芯片的圖形卡。而FireGL小組則采用IBM Rasterizer及RC1000+GT1000等圖形核心陸續推出了FireGL 1~FireGL 4共4片專業圖形卡和Quadro分庭抗禮。之后的事情相信大家也很清楚了,Sonic Blue再次完蛋,S3被VIA買下,FireGL則被出售給了ATi,拉開了ATi切入專業圖形卡市場的序幕。
FireGL并入ATi近一年后,采用ATi Radeon8500 GPU推出了基于DirectX 8的FireGL 8800/8700。但是R200內核設計顯然不適合用作專業用途,DirectX 8在專業領域面對OpenGL依然顯得太嫩了,所以FireGL 8800/8700最終只能依靠低價占領市場。緊接著3ds max加入了D3D 9支持,而3ds max的D3D執行效率竟然超過OpenGL。ATi的Radeon 9700系列也通過DX9揚眉吐氣。基于R300內核的FireGL X1自然也趁勢出擊給予了Quadro強力的阻擊。
在經歷了近10年的發展之后,專業圖形卡已經非常成熟。在我們以往測試過的所有專業圖形卡中都展示了許多一致的特性。對于新一代專業圖形卡我們認為它們必須具備以下特性,才能滿足我們不斷提升的需求。
- 基于PCI Express Graphic(X16)接口
盡管使用PCI Express Graphic(X16,以下簡稱PEG)接口的娛樂用圖形卡對比相同型號的AGP圖形卡在性能上的優勢微弱,但這并不代表PEG接口所提供的性能僅稍好于AGP 8X。在絕大部分游戲應用中所需要調用的紋理容量基本很少超過256MB。而在專業應用中,所需要的紋理卻經常突破1GB。要高效的對這些紋理進行操作,顯然需要1GB以上的顯存,可惜的是如此大量顯存的顯卡價格將會驚人的昂貴。于是將紋理存儲在系統內存中會是一個折中的辦法,要高效的調用系統內存中的紋理,顯然需要高速的接口,此時PEG接口的性能表現絕對超乎你的想象。
Dual DVI-I接口是專業圖形卡必然的選擇。DVI-I接口的好處是你可以根據需要使用轉換頭而將他們輕易的變成D-Sub輸出,但是如果你僅僅只有1個 DVI-I和1個D-sub輸出,在連接DVI設備時將會遇到極大的限制。與此同時,圖形卡所能提供的最大輸出分辨率也需要特別注意。許多設計師喜歡使用 22寸甚至更大的顯示器,這些顯示器的分辨率有1920x1200甚至更高,圖形卡能否在如此高分辨率情況下提供清晰穩定的輸出和所需刷新率也需要特別關注。
除了視頻輸出外,集群多屏渲染用戶還需要GenLock接口和FrameLock接口以保證所有系統刷新率上同步,從而保證渲染、演示結果的正確。而要求更高的用戶恐怕還需要SDI接口直接輸出未壓縮的SD/HD視頻信號和立體眼鏡接口。在選購專業圖形卡時,我們必須要清楚的了解所需端口。
小知識:
什么GenLock、FrameLock?
Genlock(Generator Lock)其實就是提供該顯卡刷新率信號的端口。在多個顯卡/系統連接進行共同輸出時(如視頻墻、超高清晰度衛星地圖顯示)多個系統會因為行刷新率的不同導致畫面出現閃爍或者條紋。GenLock接口則能夠將顯卡的內部刷新率型號告知其他系統的顯卡,在共同進行連續視頻輸出時保持行刷新同步,避免這些情況的發生。
在進行集群渲染和可視化模擬時,每個顯示系統所分到的任務量并不是一致的,復雜度的不同渲染時間自然也就不同,他們在進行共同輸出時就會導致最終畫面錯誤或者破碎。所以我們需要通過FrameLock接口來傳輸數據緩存同步信號和行刷新信號,以保證整個集群中所有系統最終顯示速率的一致和渲染結果的正確。
什么是SDI?

QuadroFX 4000 SDI上的HD/SD通用10bit SDI接口
SDI(Serial Digital Interface,串行數字接口)是一種被廣泛應用在專業視頻編輯廣播領域的接口。該接口的速度為270Mb/s,能夠傳輸10bit精度,未經任何壓縮的數字視頻信號。是傳輸質量最高的數字視頻接口之一。常用于連接非線性視頻編輯系統和線性視頻編輯系統,也有用SDI接口進行直接視頻輸出和錄像。隨著高清晰電視的來臨, SDI接口也發展出了HD-SDI格式。
DirectX是娛樂顯卡所必須遵循的規范,而專業圖形卡所必須遵循的規范顯然就是OpenGL了。OpenGL 1.0盡管已經發表了近十年,但靈活的擴展性和開放性使得OpenGL依然成為最強悍的圖形API。事實上,所有關于圖形學的研究都涉及OpenGL,所有的專業2D、3D程序都構建在OpenGL之上。專業圖形卡只有提供對OpenGL完善的支持,才能正確的運行所有應用。
隨著OpenGL 2.0的發布,各專業圖形卡制造商也紛紛推出了支持OpenGL 2.0的驅動程序。3Dlabs作為OpenGL的締造者之一,表現當然是驚人的迅速。而NVIDIA的OpenGL 2.0驅動也緊隨其后。至于ATI則步伐相對慢了一點。
在幾百個小時的工作即將完成時,系統的突然崩潰!這樣一次崩潰往往會對用戶造成極大的損失。專業工作站基本都是7x24不間斷工作的,這樣的工作環境對于硬件來說絕對是個挑戰。因此所有的專業圖形卡都不惜工本的采用最為頂級的元件和較為保守的設計。所以即便是做工遠超同系列游戲卡的專業圖形卡,其核心/顯存頻率較之依然有所降低。
在驅動方面,專業圖形卡為了保證渲染結果和精度往往也會犧牲一定的速度。與此同時,為了獲得對相應軟件的完美支持,各大圖形卡制造商還與軟件生產商進行相互的合作,甚至有專門對應某軟件的驅動版本以便獲得速度和穩定性的提升。在廠商認證方面,無論是NVIDIA還是3Dlabs抑或ATi都做的相當好,幾乎所有找得到的DCC、CAD等軟件都有相應的通過廠商認證的驅動。
幾乎所有的3D工作者都會遇到這樣的情況:在3D軟件中建模完成之后,發現有些圓弧部分、人體的關節部分有明顯閃爍的黑點,或者是直接破裂。這樣的情況就是專業圖形卡的精度不足導致的。早期ATi的專業圖形卡如FireGL X1只有4bit的子象素精度,同時Z-Buffer的精度也較為底下,在渲染大部分圓弧過渡的對象時都會產生破裂和黑點。而3Dlabs和NVIDIA 則很早就將子象素精度提高到了12bit甚至是16bit,徹底杜絕了該問題的產生。在我們本次的測試中,所有顯卡都沒有發生因為子象素精度不足導致的畫面錯誤。
這次測試的產品包括NVIDIA的QuadroFX 1400、ATi的FireGL V7100以及3Dlabs的Wildcat Realizm 800共三塊專業顯卡,測試平臺方面,我們選擇了兩顆AMD Opteron 875雙核心處理器、4條Corsair DDR400內存(帶ECC檢驗),而主板則選擇了泰安S2895,采用nForce Professional芯片組。
眾所周知,nVIDIA是現在全球顯卡領域的龍頭大哥,不但在個人電腦游戲顯卡獨樹一幟,而且在專業繪圖顯卡也擁有雄厚的技術實力。特別是 Quadro FX系列,更適用于CAD和科研應用的性能最高的圖形處理解決方案,今天我們IT評測室就為大家帶來Quadro FX1400的實物介紹。
初看到該款麗臺Quadro FX1400專業繪圖顯卡外觀,和我們現在的游戲顯卡區別并不大。然而它卻擁有業界唯一真正的128位浮點運算的3D圖形渲染管線,能夠在一個寬廣的動態范圍內,提供給圖形成千上萬種色彩,同時還提供令人驚訝的視覺沖擊以及最高的精度,遠遠滿足復雜的3D效果圖需要的眾多高準確度的數據運算要求。

另外就專業顯卡來說,想必大家平時也很少接觸和了解到,專業繪圖顯卡與高端 3D 游戲卡之間的要求和差別簡單來說就是:專業繪圖顯卡是用來建立游戲中使用的模型/環境,而游戲卡則只是為了玩游戲。游戲主要要求在一個窗口獲得高幀幅率。專業繪圖顯卡需要解決的問題在于,使用極其先進而復雜的應用程序,同時在輪廓線和深淺模式中運行,且同時開啟或關閉多個窗口及菜單,專業繪圖顯卡的設計也要能夠處理百萬多邊形的較大文件。

這就是Quadro FX 1400的核心所在

顯存方面,該款顯卡采用的是HY顆粒,采用128 MB 256 bit DDR SDRAM內存規格
ATi和nVIDIA一樣,都在專業顯卡領域逐漸獲得了相當程度的認可,不過和NVIDIA不同,ATI在專業領域的進步并不一帆風順,一方面是ATI自身在技術方面與NVIDIA并不完全兼容,而NVIDIA則在行業里處于規范制訂者行列,與“行業規范制訂者”不同必然會產生一些負面影響,另一方面 ATI在專業領域的宣傳并不是很花精力,與NVIDIA不遺余力地力推其高端專業產品相比,ATI的操作略顯保守。
這款是來自ATI FireGL PCI-Express系列中最高規格的FireGL V7100,或者可以說就是ATi Radeon X800XT的專業版本。
FireGL V7100從硬件規格看其實和X800XT一模一樣,外觀上的差異也僅僅只在于顯卡所提供的顯示輸出接口或是多幾個電容、電阻,并沒有什么太突出的地方。這點和NVIDIA同出一脈,都采用使用軟件識別的方式區分專業和非專業顯卡,從而實現降低研發成本的目的。

顯卡使用的顯存為2ns規格,默認頻率1GHz。我們注意到在每顆顯存的邊上都有一個空焊位,而這塊樣卡是256MB規格,也就是說未來會提供 512MB顯存規格的產品,從而實現更加強大的性能。256MB顯存在目前頂級專業顯卡領域中不具有競爭優勢,想必ATI也是非常清楚的。

FireGL V7100的核心和普通的X800XT沒有什么區別,只是名稱換成了FireGL。事實上,目前雖然我們沒有更詳細對這款顯卡進行測試,但它的硬件規格、軟件配套都還不能讓我們為之動心,希望在未來的評測中能看到優秀的性能表現,但也必須指出一點,要指望它在整個評測中獲得最好的表現從我的角度來看未免難度太大。
如果你是一個顯卡發燒友,如果你在為你的PCI-E顯卡而自豪,如果你還在為雙顯卡SLI技術而垂涎欲滴,如果你還在為256bit顯存位寬而感到沾沾自喜,如果你還在渴望能有512MB的顯存來玩轉DOOM3,那么我奉勸你一定要來看看這款顯卡——3Dlabs的Wildcat Realizm 800。
隨著NVIDIA和ATI在專業顯卡領域的不斷突飛猛進,很多人開始逐漸遺忘一個曾經在業內呼風喚雨的專業顯卡產品設計與制造的老大級人物 ——3Dlabs。專業顯卡的評測在業內并不多,而家用游戲顯卡則不斷受到大眾媒體的追捧,隨著家用游戲顯卡在3D技術方面的不斷進步,NVIDIA和 ATI不斷得到媒體的曝光,專業顯卡方面也乘機獲得了大量的造勢宣傳幫助,相反3Dlabs即便擁有強悍的產品卻苦于“報效無門”,無處宣傳。

我在北京有一個朋友專門經營面向專業用戶的產品,平時我所需要得到的一些專業技術方面的幫助也主要來自于他,他對于我們近期發布的《強到極限概念工作站級平臺獨家賞析》非常感興趣,更對我們計劃制作專業的工作站平臺評測極為支持。其實原本在我們的計劃中并沒有考慮增加3Dlabs方面的產品評測,因為畢竟對我們絕大多數人來說,它的顯卡實在超出了我們所需要的范圍,不過他的誠懇與熱情還是打動了我們,并且,更多的專業顯卡顯然能更加幫助我們的專業評測獲得更多數據,并具有更強的說服力,因此來自3Dlabs的頂級民用專業工作站顯卡Wildcat Realizm 800來到了我們的評測室。

樸素的顯卡包裝盒內裝著的配件屈指可數,一塊顯卡(其實或者應該說是一塊磚頭),一本說明書,一張驅動光盤,一小盒DVI轉VGA接口(兩個)和一根用于將4PIN電源通用線纜轉為顯卡上專用的6PIN接口使用的轉接線。其實我從來沒有指望過在我上次收藏了一塊Voodoo5 5500之后還會有更加夸張的超大顯卡擺在我的面前,這次這款Realizm 800擺在我的面前時我著實想了好久怎樣才能把它鎖進抽屜——因為它的長度已經超過抽屜。什么?您問我如何把它裝進機箱?嗯……說實話,其實這件事我壓根沒考慮過,專業工作站應該會有它能匹配的機箱使用吧,家用機箱要想用這塊顯卡的話,估計得在機箱前面板打上一個大洞才有可能。

任何一個發燒友都會很想看到這款專業頂級工作站顯卡驚人巨大的散熱器之下的各種芯片(組),不過我們在經過詳細考慮之后還是決定暫時不拆,除了考慮到是否會產生損壞等問題,另一個重要的問題是拆完這些散熱器之后如何裝好,并保證散熱能力實在是一件非常考驗我們的事。為了保證在測試過程中不會損壞,我們決定將這個操作步驟留到評測結束之后。

本文的開始,我們提到了關于顯卡的規格,事實上這款顯卡的規格的確足以讓所有人為之傾倒。該款顯卡采用的是新規格的PCI-Ex16接口,接口默認速率為上下行共8GB/s的數據傳輸率。在基本處理器配置方面,它擁有兩顆VPU和一顆獨立的VSU。所謂的獨立VSU全稱是 Vertex/Scalability Unit,直譯為頂點數據平衡處理單元,它的用途是用于平衡兩顆VPU處理器的運算負荷。Realizm 800使用的兩顆VPU運行頻率無法判斷,3Dlabs暫時也沒有公開宣布,它的另一款Realizm 200使用的是1顆VPU,在過去的測試中反應出的結果是Realizm 800略微領先Realizm 200大概20%。
在處理核心方面的優勢在于,3Dlabs保證這款顯卡在多VPU負荷方面采用硬件級別(VSU)的內置平衡系統,不會出現兼容性問題的同時還保證了性能的提升,相反而言,NVIDIA目前提出的SLI技術,在實現過程中可能受到種種限制,目前在游戲方面的限制就需要軟件的支持,在專業軟件方面還有更多未知因素等待。那么,如果NVIDIA推出類似GIGABYTE的3D1式專業顯卡是否能解決這個問題呢?恐怕很難,3Dlabs通過VSU來實現硬件的多VPU任務平衡,而SLI是軟件型的支持,并且是通過一定的程序識別后激活SLI支持,屬于一種軟件式的任務平衡,與Realizm 800的多VPU技術還是有一定的差距。
在顯存方面,Realizm 800使用了20顆顯存,容量規格高達640MB,其中512MB為通用顯存,另外128MB為直聯突發顯存。通用顯存的內存位寬高達512bit,而 128MB突發顯存位寬則為128bit。不過其中512MB通用顯存根據我們的判斷為兩顆VPU各擁有256MB/256bit,在3Dlabs方面則將其等效為512bit來進行宣傳。
無論如何,3Dlabs這款Wildcat Realizm 800給我們提供的性能感受都會是驚人的。
測試結果與分析:SPEC Viewpref 8.01

在整個測試中,我們采用了SPEC組織提供的VIewperf 8和SPECapc測試套件。SPEC(Standard Performance Evaluation Corporation)是由IBM、Intel、SGI、ATi、NVIDIA等幾十個業界領導企業于1988年共同組成的計算機性能評估小組。時至今日,SPEC已經有上百個會員,他們幾乎囊括了我們所熟知的所有硬件制造商。與此同時,SPEC的組織結構也有了較大的發展,SPEC旗下分為3個小組,分別是著重于系統圖形運算性能評估的The Graphics Performance Characterization Group (GPC)、著重于對超級計算機和高性能計算機進行性能評估的The High-Performance Group (HPG)和著重于對普通工作站、服務器性能進行評估的The Open Systems Group (OSG)。
SPEC在高端性能評估方面有著絕對的領導力——所有的測試都基于真實腳本、所有的測試都對會員提供源代碼。幾乎所有的研究機構都用SPEC套件來衡量系統的運行速度,世界超級計算機500強(Top500)也采用了SPEC測試套件來進行性能模擬。
SPEC Viewpref 8.01
在本次測試中,我們首先使用了合成類的SPEC Viewpref 8.01進行測試。SPEC Viewpref 8.01包含7個真實測試腳本,分別基于入門3D軟件3ds max 3.1、工程設計軟件CATIA V5R12、科學可視化模擬軟件CEI EnSight、室內建模軟件Lightscape Visualization System、中端3D設計軟件Maya 5.0、工程虛擬設計裝配軟件PTC Pro/Engineer 2001、Solidworks 2004 k、Unigraphics V17。








在Viewpref 8.01的測試中,擁有2個VPU和1個VSU加上512MB顯存的3dlabs Wildcat Realizm 800以壓倒性的優勢超過了ATi FireGL V7100和NVIDIA QuadroFX 1400及QuadroFX 1400 SLI。在OpenGL應用中3Dlabs徹底可編程的流水線、額外存放指令的128MB存儲器、單獨的幾何(Vertex Shader)及負載平衡VSU體現出了應有的價值。這樣的性能優勢,即便是面對同級別的Quadro FX 4400也能毫無懼色。
經過幾年的耕耘,ATi FireGL也迎來了他們的收獲。與之前的產品相比,ATi FireGL V7100表現的性能已經有了長足的進步。但ATi R300/R420 GPU的體系結構在運行OpenGL應用時的效率較為底下的問題似乎依然困擾著FireGL。在絕大部分應用中,擁有16條流水線的FireGL V7100性能甚至不敵檔次更低的QuadroFX 1400。也許ATi是時候重寫OpenGL引擎代碼了。
QuadroFX 1400是我們所測試最具性價比的專業圖形卡產品、QuadroFX 1400的價格僅有上面2款產品的一半,甚至更低。但是QuadroFX 1400所能提供的性能卻不僅僅是50%。得益于NV4x體系結構,NVIDIA QuadroFX 1400在較小晶體管規模上實現較高的專業性能。需要指出的是,NVIDIA在專業圖形卡方面的軟件開發力度相當大,不僅提供了完善的Forceware 驅動,還額外提供了為加速AutoCAD預覽的PowerDraf、加速3ds max Viewport預覽的Maxtreme7等軟件。近期NVIDIA推出的NVIDIA Gelato離限渲染器更是實現了完整硬件加速的最終渲染。
隨后我們采用了SPECapc For Maya 6和SPECapc For 3ds max 7兩個套件對圖形卡的實際性能進行考察。SPECapc和上面的Viewpref 8.01不同,SPECapc需要完整版本的Maya 6和3ds max 7,同時SPEC僅僅提供相應的腳本設置和最終加權得分計算方法。這些測試都將在各個軟件內部完成。
SPECapc For maya 6測試由3個場景共30項測試組成,其中27項測試將會循環運行3次。其中魷魚、螞蟻兩個場景由NVIDIA提交,SPEC全體成員審核通過。在 SPECapc for Maya測試中圖形子系統性能將會占總成績的70%,而CPU性能占20%、I/O子系統(包含內存速度和硬盤速度)性能占10%。在這個測試中,得分為 1的參考系統為Pentium 4 1.5GHz、1GB PC800 ECC RDRAM和NVIDIA Quadro2 Pro圖形卡、20GB ATA/100硬盤。如果目標系統的得分為2,則可以表明在日常使用中完成相同工作量,目標系統只需要耗費參考系統50%的時間。
在本次測試中NVIDIA QuadroFX 1400 SLI取得了最高圖形性能得分,QuadroFX 1400緊隨其次。QuadroFX 1400的全面勝利,源于NVIDIA驅動能夠完整的提供Maya Hardware Rendering的硬件加速支持。3dlabs Wildcat Realizm 800由于驅動程序缺乏相應的支持,導致成績墊底。而FireGL V7100同樣因為對Maya硬件渲染和實時預覽的支持問題導致成績偏低。
測試結果與分析:SPECapc for 3ds max 7
SPECapc for 3ds max7包含眾多的測試場景,場景選擇覆蓋了簡單的三角形到復雜建模和大型場景。由于在3ds max7中DirectX加速和OpenGL加速都已經相當完善,而DirectX加速甚至效率更高,因此SPECapc for 3ds max7測試中包含了OpenGL和DX 2種執行路徑。該測試的參考平臺為Intel Xeon 2.4GHz、1GB PC800 RDRAM、Quadro XGL700圖形卡和40GB ATA/100硬盤。
在3ds max7測試中3dlabs Wildcat Realizm 800占據了頭把交易,而QuadroFX 1400 SLI緊隨其后,FireGL V7100位居第三。QuadroFX 1400墊底。這樣的性能結果幾乎和他們各自的售價成正比。但是Wildcat Realizm 800由于缺少對3ds max 7 Viewport的實時加速工具,導致性能成績偏低,未能徹底釋放Realizm 800的性能。
在我們完成了所有專業圖形卡測試之后,我們發現單論性能,專業圖形卡發展的速度極其迅猛。3dlabs依靠Wildcat Reailzm 800再次向世人展示了他的力量,而NVIDIA的QuadroFX 1400則刷新了專業圖形卡性能價格比的標準。至于ATi FireGL V7100則依然缺乏強大的競爭力。如果你的工作包含極端復雜的3D模型和海量的紋理,那3dlabs Wildcat Realizm 800將有助你顯著提升工作效率。對于預算有限的SOHO設計師和初學者來說QuadroFX 1400將會是他們最佳選擇。
在整個測試中,對專業圖形卡的功能和加速范圍上我們依然有所期待。現在市場上所有專業圖形卡在最終渲染方面都無能為力,在Mental Ray、Final Render等渲染器大行其道的今天,顯然最終渲染耗費了大量的時間。要加速GI渲染,我們需要的更像是IBM Cell處理器那樣的MIMD處理能力,而不是游戲卡上極端的填充率和幾何設置能力。在經歷了游戲和專業的融合之后,也許今天游戲圖形卡和專業圖形卡應該再次分道揚鑣、各自發展了?