• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            VC++ C++ C# Algorithm

            C++博客 首頁 新隨筆 聯(lián)系 聚合 管理
              21 Posts :: 3 Stories :: 31 Comments :: 0 Trackbacks
            今天偶爾看道了計(jì)算機(jī)體系結(jié)構(gòu)中有關(guān)編譯器優(yōu)化對(duì)提高Cache性能的影響一節(jié),其中說道如果有數(shù)組,假設(shè)int a[5000][100],我們寫下如下代碼,則第一種效率高于第二種。原因是第二個(gè)循環(huán)以100*4字節(jié)的跨距訪問存儲(chǔ)器,勢(shì)必造成Cache失效次數(shù)增加,增大了訪存時(shí)間,而第一種循環(huán)順序地訪問一個(gè)Cache塊中地元素,減少了失效次數(shù),提高了Cache性能。
            ?14-4(a)
            ?2
            for?(row=0;?row<5000;?row++)
            ?
            3{
            ?
            4??for?(?col=0;?col<100;?col++?)
            ?
            5??{
            ?
            6?????sum?=?sum?+?a[row][col];
            ?
            7??}

            ?
            8}

            ?
            94-4(b)
            10
            for?(col=0;?col<100;?col++?)
            11{
            12??for?(row=0;?row<5000;?row++)
            13??{
            14????sum?=?sum?+?a[row][col];
            15??}

            16}

            但我又想起了林銳博士的高質(zhì)量C++編程手冊(cè),其中寫到:在多重循環(huán)中,如果有可能,應(yīng)當(dāng)將最長(zhǎng)的循環(huán)放在最內(nèi)層,最短的循環(huán)放在最外層,以減少CPU 跨切循環(huán)層的次數(shù)。按照他的說法,上面二種寫法,后一種比較好,這不就跟體系結(jié)構(gòu)書上說的矛盾了嗎?我不知道誰對(duì)誰錯(cuò),也不知道減少CPU 跨切循環(huán)層的次數(shù)是怎么具體影響效率,大家不知有何看法。
            posted on 2006-12-17 23:14 大熊貓 閱讀(1402) 評(píng)論(4)  編輯 收藏 引用

            Feedback

            # re: 循環(huán)的效率 2006-12-18 11:14 LOGOS
            寫成 for (i=0; i<row*col; ++i)如何?  回復(fù)  更多評(píng)論
              

            # re: 循環(huán)的效率 2006-12-18 12:38 shephard
            CPU一個(gè)才多少錢,人腦一個(gè)要多少錢
            兩種寫法的CPU周期才差多少,在一個(gè)團(tuán)隊(duì)里溝通兩種寫法的區(qū)別又要花多少人月
            說實(shí)話,覺得這樣在意效率真的沒什么意思
            畢竟近五年內(nèi),可能的巨大效率提升還是會(huì)發(fā)生在多線程上  回復(fù)  更多評(píng)論
              

            # re: 循環(huán)的效率 2006-12-18 12:49 WeiFeng
            原來早就有人對(duì)這點(diǎn)產(chǎn)生懷疑了,去看看吧
            http://www.linuxsir.org/bbs/printthread.php?t=248134  回復(fù)  更多評(píng)論
              

            # re: 循環(huán)的效率 2006-12-18 18:24 liuliu
            這個(gè)例子其實(shí)不好,因?yàn)檫@里的效率差別主要在于對(duì)內(nèi)存中數(shù)組元素的訪問是否連續(xù)了。如果把內(nèi)層循環(huán)內(nèi)容改為空或者改為sum=1之類,對(duì)于for本身的耗費(fèi)應(yīng)該可以看到差別。
            如果沒有其他影響因素,把循環(huán)次數(shù)多的for寫在內(nèi)層肯定是有好書的。
            首先,對(duì)于內(nèi)層,每個(gè)for“本身”都執(zhí)行了100*5000次,而對(duì)于外層,卻是不同,分別為100和5000,這里可能有些差別。
            另外,我想也是更主要的一點(diǎn),(a)的內(nèi)層循環(huán)連續(xù)執(zhí)行100次后要被打斷一次執(zhí)行外部循環(huán),如果內(nèi)層有內(nèi)容,連續(xù)執(zhí)行肯定可以更有效的利用register和cache,而每次打斷可能會(huì)需要一些外部的交換操作。相比之下,(b)就是連續(xù)執(zhí)行5000次后被打斷一次,一共被打斷100次,這里的開銷差別如果在苛刻的條件下,肯定需要考慮的。
            不過,一般情況下,應(yīng)該差別不大,特別是相對(duì)于內(nèi)存甚至IO操作,比如上面這個(gè)例子的col和row。如果這兩者影響同時(shí)存在,考慮了for的問題而忘記了內(nèi)存操作,那就是本末倒置了,畢竟一個(gè)是register或cache級(jí)別的,一個(gè)是memory級(jí)別的,差大了。
            個(gè)人理解,不一定對(duì):)  回復(fù)  更多評(píng)論
              


            只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
            網(wǎng)站導(dǎo)航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


            久久综合日本熟妇| 久久久无码一区二区三区| 久久国产热这里只有精品| 亚洲国产精品嫩草影院久久| 国内精品综合久久久40p| 久久99中文字幕久久| 一97日本道伊人久久综合影院| 久久亚洲中文字幕精品一区| 99久久人妻无码精品系列| 精品久久久久久无码中文字幕| 伊人久久大香线蕉亚洲| 国产亚洲色婷婷久久99精品91| 久久人人爽人人爽人人片av麻烦 | 久久天天躁狠狠躁夜夜网站| 丁香五月网久久综合| 久久免费视频1| A级毛片无码久久精品免费| 日韩精品久久久肉伦网站| 久久毛片免费看一区二区三区| 久久99国产乱子伦精品免费| 亚洲&#228;v永久无码精品天堂久久 | 老色鬼久久亚洲AV综合| 久久久精品日本一区二区三区 | 久久精品国产日本波多野结衣 | 久久久久久久波多野结衣高潮| 国产一区二区精品久久岳| 久久不见久久见免费视频7| 久久国产色av免费看| 麻豆av久久av盛宴av| 天堂无码久久综合东京热| 久久精品国产亚洲一区二区三区| 国产精品美女久久久久久2018| 亚洲精品白浆高清久久久久久| 精品久久久久久久国产潘金莲| 欧美日韩精品久久久久| 久久亚洲2019中文字幕| 久久久久国产日韩精品网站| 久久精品国产亚洲Aⅴ香蕉 | 国产午夜电影久久| 狠狠综合久久综合中文88 | 一级做a爰片久久毛片人呢|