91久久久久久,老司机aⅴ在线精品导航,亚洲综合好骚

數組左旋轉k位 —— C++標準算法庫中最悲劇的函數：rotate

要將一個數組的所有元素向左旋轉k位，通常有三種算法：

算法1（分組交換）：

若a長度大于b，將ab分成a₀a₁b，交換a₀和b，得ba₁a₀，只需再交換a₁和a₀。

若a長度小于b，將ab分成ab₀b₁，交換a和b₀，得b₀ab₁，只需再交換a和b₁。

不斷將數組劃分和交換，直到不能再劃分為止。分組過程與求最大公約數很相似。

讀寫內存各 n到2*n次

算法2 (三次反轉)

利用ba=(b^r)^r(a^r)^r=(a^rb^r)^r，先分別反轉a、b，最后再對所有元素進行一次反轉。

讀寫內存各約2*n次

算法3 （使用循環鏈）

假設 n、k的最大公約數為M，則所有序號為 (i + j*k) % n (0<= i < M, 0 <= j < n/M)的元素，構成M個循環鏈（i值相同的在同一個循環鏈上），每個循環鏈上的元素移動到前一個元素的元素，就可以交換到最終結果上的位置，因而總共只要讀寫內存各n次。（比如： 1 2 3 4 5 6，左移2位， 1 3 5 和 2 4 6分別構成兩個循環鏈。）

事實上C++標準算法庫提供了現成的函數：rotate函數。按理說，幾種算法都比較簡單，編譯器的庫函數又是經過時間檢驗的，效率即使比手寫的差，也不會差太多。但如果對rotate函數進行測試的話，可能會發現標準庫的版本慢得可不是一點點。

對VC 2010，運行后面的測試程序，自定義函數（采用算法2）要用99ms，而std::rotate卻要1656ms。是庫的實現者不懂得用這個簡單的算法嗎？檢查下庫的源代碼，就會發現：標準算法庫中，對C++的三種迭代器（前向迭代器、雙向迭代器，隨機訪問迭代器），分別采用了上面三種算法。直接調用其內部的實現（std::_Rotat函數），重新測試下，可得到下面結果：

迭代器	前向（算法1）	雙向（算法2）	隨機訪問（算法3）
時間（ms）	46	99	1651

（使用GCC的，請用版本號低于4.5的進行測試）

從結果可以看出，效率是：算法1 > 算法2 >>> 算法3。

從理論上講，算法3只要讀寫內存各n次，應該是效率最高的算法。這在每次內存讀寫的開銷相差不大時成立。但實際上，由于硬件限制，CPU對內存的訪問采用分級緩存機制：一級緩存容量很小但訪問速度最快，存放程序的指令和最常用的數據，而二、三級緩存容量較大但訪問速度要慢很多。CPU是無法繞過緩存直接訪問內存數據（某些特殊指令可以不用一二三級緩存，但它也要用到其它專用緩存），對不在緩存中的數據，必須先載入到緩存中，這個操作是相當昂貴的。對大數組來說，不可能將所有數據都存放在緩存中，而對內存的不連續訪問，CPU對內存定位的開銷（各級緩存間數據的調整，反復移入或移出數據到緩存）是巨大的，這就造成了算法3的性能在該情況下非常差。測試發現，k = 3時，該算法的效率就已經相當差了。對小數組，盡管該算法讀寫次數少，但由于各種算法所用時間都很小，這種優勢很難體現出來。可以說，算法3在數學上是非常優美的，但是在實際應用中，是一種相當差的算法。

對算法的選擇，不應該忽視內存因素。在對隨機訪問迭代器版本的roate實現上犯這個錯誤的，可不僅僅是VC，還有著名的STL Port、GCC（GCC從4.5開始libstdc++改用算法1，并做了些優化），以及新興的libc++。（其它的編譯器/庫沒用過，也就沒有測試。）

另外，測試時發現VC 2010的一個bug：前向迭代器的實現版本，當k = 0時，程序直接掛了。

測試代碼：

rotate

posted on 2011-05-27 21:04 flyinghearts 閱讀(2059) 評論(2) 編輯收藏引用所屬分類: 算法、C++

拿什么數據類型測的？對于簡單數據類型，第3種算法慢的原因在于做除法(取模)。數學理論不可能去考慮現在的X86指令怎么執行耗費的少。而且rotate使用的場合很少，原地歸并排序和排列組合用上了，但不是用的第3種，其它地方似乎很少用。回復更多評論

# re: 數組左旋轉k位 —— C++標準算法庫中最悲劇的函數：rotate 2011-07-08 22:59 flyinghearts

@Chipset
到模并不慢。
if (a == k) a = 0; 很可能比 a %= k; 慢很多

對內存的不連續訪問，才是根本原因。

回復更多評論

刷新評論列表

只有注冊用戶登錄后才能發表評論。
【推薦】100%開源！大型工業跨平臺軟件C++源碼提供，建模，組態！

相關文章: 面試題: 找出數組中三個只出現一次的數避免計算過程中出現溢出的一個技巧 Fibonacci數計算中的兩個思維盲點及其擴展數列的通用高效解法喝汽水問題對環狀數組求連續子數組的最大和最短摘要的生成（補充） Fibonacci數列的兩種O(lgn)解法點在三角形內　之二（三維坐標系1）點在多邊形內點在三角形內（1）

網站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

雁過無痕

留言簿(7)

隨筆分類

隨筆檔案

搜索

最新隨筆

最新評論

閱讀排行榜

評論排行榜

評論