• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            We build the dream world digital.

            C++博客 首頁 新隨筆 聯(lián)系 聚合 管理
              2 Posts :: 0 Stories :: 8 Comments :: 0 Trackbacks

            2007年1月16日 #

                 摘要: 使用基于GPU的Geometry Clipmaps進(jìn)行地形渲染 Terrain Rendering Using GPU-Based Geometry Clipmaps ...  閱讀全文
            posted @ 2007-01-16 17:36 如展 閱讀(2303) | 評(píng)論 (2)編輯 收藏

            2007年1月5日 #

            SSE Assembler vs Optimizied C++
            打破匯編的神話?


            匯編語言對(duì)于軟件工程人員來說,是高速精簡(jiǎn)的代稱,但同時(shí)也是晦澀難懂的代名詞。學(xué)校的老師,各種各樣的書籍寶典,總是舉出各種各樣的例子來向我們灌輸著這樣一個(gè)定律:C++編譯后產(chǎn)生的代碼在執(zhí)行效率上不如匯編編譯成機(jī)器代碼。但是匯編代碼在編寫的時(shí)候晦澀難懂,使得開發(fā)效率大為降低。但是在那個(gè)CPU寄存器非常珍貴,內(nèi)存異樣稀少的時(shí)代,匯編相對(duì)C有著獨(dú)特的優(yōu)勢(shì),可以極其精確的為每一個(gè)變量分配寄存器和內(nèi)存,但是同時(shí)也使得開發(fā)過程緩慢無比,因?yàn)橐徊涣羯窬蜁?huì)造成寄存器分配沖突。同時(shí)由于那個(gè)時(shí)代的C++的編譯器的編譯效率不高,造成了編譯的時(shí)候產(chǎn)生的代碼無論在算法和體積上都無法和匯編相比。

            最近在編寫引擎的時(shí)候,一直在匯編的執(zhí)行效率和C++的編寫效率上猶豫不覺。一開始試著編寫了2個(gè)不同版本的Vector類,叉積分別使用SSE匯編和C++優(yōu)化。然后我試著編譯了這兩個(gè)不同的版本,編譯的時(shí)候?qū)⑺袃?yōu)化選項(xiàng)全部打開,并最大化速度優(yōu)先。測(cè)試程序?qū)τ诿總€(gè)版本調(diào)用1億次叉積運(yùn)算,總共進(jìn)行了10次,最后的出的結(jié)果令人瞠目結(jié)舌。SSE匯編10次測(cè)試全部敗于C++,C++所用的時(shí)間只相當(dāng)于SSE的三分之一。

            今天新編了一個(gè)四元數(shù)類,同樣在從四元數(shù)向矩陣的轉(zhuǎn)換中,使用了Intel網(wǎng)站上的Id Software的匯編代碼,和C++代碼。同樣進(jìn)行速度最大化優(yōu)化,1億次轉(zhuǎn)換測(cè)試,結(jié)果在預(yù)測(cè)之內(nèi),差別雖然沒有向量測(cè)試的那么驚人,但C++仍然比匯編高效。

            新一代編譯器都支持在編譯時(shí)打開SSE增強(qiáng)指令集,這意味著,包括Visual Studio在內(nèi)的C++編譯器,能夠在從C/C++到匯編代碼的過程中,自動(dòng)盡可能的使用SSE增強(qiáng)指令集來提高匯編代碼效率。手寫SSE匯編,由于人員之間的水平差異,不可能將匯編代碼優(yōu)化到最高水準(zhǔn),而編譯器使用了高效的算法來優(yōu)化產(chǎn)生的匯編代碼,這使得,一個(gè)資質(zhì)普通的程序員寫出的SSE代碼,會(huì)比由C++編譯器編譯出的匯編代碼要慢的多。當(dāng)然這個(gè)世界上總是有著驚人天賦的天才,一定能夠在同等條件下寫出比編譯器快得多的匯編代碼,但是這不具有普遍性,在軟件業(yè)高速發(fā)展的今天,通用性,易用性,費(fèi)效比,以及重用性才是軟件工程中最重要的,而花大錢雇一個(gè)匯編高手來寫核心意味著這個(gè)代碼具有最差的移植性,最差的可讀性,以及最差的重用性,這是不可取的。

            我們應(yīng)該相信現(xiàn)代編譯器能夠在最短時(shí)間內(nèi)編譯出最優(yōu)代碼,而事實(shí)上,這個(gè)也已經(jīng)成為了既定的現(xiàn)實(shí)。拋棄手動(dòng)的SSE匯編,讓編譯器來完成這項(xiàng)工作,是最明智的做法。當(dāng)然我們應(yīng)該在編寫C++代碼時(shí)稍微考慮一下數(shù)據(jù)流的生成順序,以便讓編譯器發(fā)揮出最大效能,至于如何優(yōu)化數(shù)據(jù)流,將在下一篇中介紹。

            ps: 在Visual Studio.NET 2003下,將“啟用增強(qiáng)指令集”設(shè)置為SSE/SSE2即可。

            posted @ 2007-01-05 11:35 如展 閱讀(1755) | 評(píng)論 (6)編輯 收藏

            僅列出標(biāo)題  
            久久天天躁狠狠躁夜夜2020一| 色综合久久无码五十路人妻| 久久香蕉综合色一综合色88| 久久99国产精品久久| 久久国产精品一区| 嫩草伊人久久精品少妇AV| 国产精品99久久精品爆乳| 思思久久好好热精品国产| 国产精品久久影院| 久久精品国产AV一区二区三区| 久久久久亚洲av无码专区喷水 | 欧美亚洲国产精品久久久久| 久久久久亚洲AV成人片| 久久亚洲国产精品五月天婷| 久久婷婷五月综合色奶水99啪| 亚洲国产精品久久久久婷婷老年| 久久99国产精品久久99小说| 99久久免费只有精品国产| 久久婷婷五月综合色高清| 亚洲午夜福利精品久久| 99久久www免费人成精品| 久久国产乱子伦免费精品| 亚洲国产综合久久天堂| 久久国产午夜精品一区二区三区| 久久久久99精品成人片直播| 国产精品久久久久a影院| 久久天天躁狠狠躁夜夜2020老熟妇| 99国产欧美精品久久久蜜芽| 午夜精品久久久久久久| 狠狠色丁香久久婷婷综合蜜芽五月| 国产综合成人久久大片91| 久久青青草原综合伊人| 国产精品久久久久无码av| 久久91精品国产91久久小草 | 久久精品二区| 久久久久97国产精华液好用吗| 国产一区二区精品久久凹凸 | 国产精品gz久久久| 久久国产乱子精品免费女| 中文精品久久久久国产网址| 久久91亚洲人成电影网站|