• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            雁過無痕

              C++博客 :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理 ::

            要將一個數(shù)組的所有元素向左旋轉(zhuǎn)k位,通常有三種算法:

             

            算法1分組交換):

            若a長度大于b,將ab分成a0a1b,交換a0和b,得ba1a0,只需再交換a1 和a0

            若a長度小于b,將ab分成ab0b1,交換a和b0,得b0ab1,只需再交換a 和b1

            不斷將數(shù)組劃分和交換,直到不能再劃分為止。分組過程與求最大公約數(shù)很相似。

             讀寫內(nèi)存各 n到2*n次

             

            算法2 (三次反轉(zhuǎn))

            利用ba=(br)r(ar)r=(arbr)r,先分別反轉(zhuǎn)a、b,最后再對所有元素進行一次反轉(zhuǎn)。

            讀寫內(nèi)存各約2*n次

             

            算法3 (使用循環(huán)鏈)

            假設(shè) n、k的最大公約數(shù)為M,則所有序號為 (i + j*k) % n (0<= i < M, 0 <= j < n/M)的元素,構(gòu)成M個循環(huán)鏈(i值相同的在同一個循環(huán)鏈上), 每個循環(huán)鏈上的元素移動到前一個元素的元素,就可以交換到最終結(jié)果上的位置,因而總共只要讀寫內(nèi)存各n次。(比如: 1 2 3 4 5 6,左移2位, 1 3 5 和 2 4 6分別構(gòu)成兩個循環(huán)鏈。)

             

            事實上C++標準算法庫提供了現(xiàn)成的函數(shù):rotate函數(shù)。按理說,幾種算法都比較簡單,編譯器的庫函數(shù)又是經(jīng)過時間檢驗的,效率即使比手寫的差,也不會差太多。但如果對rotate函數(shù)進行測試的話,可能會發(fā)現(xiàn)標準庫的版本慢得可不是一點點。

            VC 2010,運行后面的測試程序,自定義函數(shù)(采用算法2)要用99ms,而std::rotate卻要1656ms。是庫的實現(xiàn)者不懂得用這個簡單的算法嗎?檢查下庫的源代碼,就會發(fā)現(xiàn):標準算法庫中,對C++的三種迭代器(前向迭代器、雙向迭代器,隨機訪問迭代器),分別采用了上面三種算法。直接調(diào)用其內(nèi)部的實現(xiàn)(std::_Rotat函數(shù)),重新測試下,可得到下面結(jié)果:

             

            迭代器

            前向(算法1

            雙向(算法2

            隨機訪問(算法3

            時間(ms

            46

            99

            1651

                    (使用GCC的,請用版本號低于4.5的進行測試)

             

                從結(jié)果可以看出,效率是:算法1 > 算法2 >>> 算法3 

             

            從理論上講,算法3只要讀寫內(nèi)存各n次,應(yīng)該是效率最高的算法。這在每次內(nèi)存讀寫的開銷相差不大時成立。但實際上,由于硬件限制,CPU對內(nèi)存的訪問采用分級緩存機制:一級緩存容量很小但訪問速度最快,存放程序的指令和最常用的數(shù)據(jù),而二、三級緩存容量較大但訪問速度要慢很多。CPU是無法繞過緩存直接訪問內(nèi)存數(shù)據(jù)(某些特殊指令可以不用一二三級緩存,但它也要用到其它專用緩存),對不在緩存中的數(shù)據(jù),必須先載入到緩存中,這個操作是相當(dāng)昂貴的。對大數(shù)組來說,不可能將所有數(shù)據(jù)都存放在緩存中,而對內(nèi)存的不連續(xù)訪問,CPU對內(nèi)存定位的開銷(各級緩存間數(shù)據(jù)的調(diào)整,反復(fù)移入或移出數(shù)據(jù)到緩存)是巨大的,這就造成了算法3的性能在該情況下非常差。測試發(fā)現(xiàn),k = 3時,該算法的效率就已經(jīng)相當(dāng)差了。對小數(shù)組,盡管該算法讀寫次數(shù)少,但由于各種算法所用時間都很小,這種優(yōu)勢很難體現(xiàn)出來。可以說,算法3在數(shù)學(xué)上是非常優(yōu)美的,但是在實際應(yīng)用中,是一種相當(dāng)差的算法。

            對算法的選擇,不應(yīng)該忽視內(nèi)存因素。在對隨機訪問迭代器版本的roate實現(xiàn)上犯這個錯誤的,可不僅僅是VC,還有著名的STL PortGCCGCC4.5開始libstdc++改用算法1,并做了些優(yōu)化),以及新興的libc++。(其它的編譯器/庫沒用過,也就沒有測試。)

             

            另外,測試時發(fā)現(xiàn)VC 2010的一個bug:前向迭代器的實現(xiàn)版本,當(dāng)k = 0時,程序直接掛了。

             

            測試代碼:


            rotate
            posted on 2011-05-27 21:04 flyinghearts 閱讀(2040) 評論(2)  編輯 收藏 引用 所屬分類: 算法C++

            評論

            # re: 數(shù)組左旋轉(zhuǎn)k位 —— C++標準算法庫中最悲劇的函數(shù):rotate[未登錄] 2011-07-08 08:46 Chipset
            拿什么數(shù)據(jù)類型測的?對于簡單數(shù)據(jù)類型,第3種算法慢的原因在于做除法(取模)。數(shù)學(xué)理論不可能去考慮現(xiàn)在的X86指令怎么執(zhí)行耗費的少。而且rotate使用的場合很少,原地歸并排序和排列組合用上了,但不是用的第3種,其它地方似乎很少用。  回復(fù)  更多評論
              

            # re: 數(shù)組左旋轉(zhuǎn)k位 —— C++標準算法庫中最悲劇的函數(shù):rotate 2011-07-08 22:59 flyinghearts
            @Chipset
            到模并不慢。
            if (a == k) a = 0; 很可能比 a %= k; 慢很多

            對內(nèi)存的不連續(xù)訪問,才是根本原因。

              回復(fù)  更多評論
              

            伊人久久大香线蕉精品不卡| 久久99国产精品二区不卡| 女同久久| 超级97碰碰碰碰久久久久最新| 久久91精品国产91| 国产91色综合久久免费| 欧美久久天天综合香蕉伊| 亚洲乱码日产精品a级毛片久久 | 久久综合狠狠综合久久综合88| 狠色狠色狠狠色综合久久| 久久久久亚洲AV无码去区首| 2020久久精品亚洲热综合一本 | 91久久精品电影| 一级A毛片免费观看久久精品| 亚洲∧v久久久无码精品| 91精品国产91久久久久久青草| 久久夜色精品国产噜噜亚洲a| 久久人爽人人爽人人片AV| 久久精品无码一区二区app| 精品久久久无码人妻中文字幕 | 久久久亚洲AV波多野结衣| AAA级久久久精品无码区| 久久99国产综合精品女同| 色偷偷88欧美精品久久久 | 久久91综合国产91久久精品| 免费精品国产日韩热久久| 一本伊大人香蕉久久网手机| 蜜臀av性久久久久蜜臀aⅴ麻豆 | 亚洲嫩草影院久久精品| 国产亚洲精品美女久久久| 亚洲国产精品嫩草影院久久 | 欧美黑人激情性久久| 久久久WWW免费人成精品| 久久久久久综合一区中文字幕| 久久综合综合久久综合| 亚洲国产另类久久久精品| 久久受www免费人成_看片中文| 国产巨作麻豆欧美亚洲综合久久| 国产ww久久久久久久久久| 93精91精品国产综合久久香蕉| 色综合久久中文综合网|