woaidongmao

文章均收錄自他人博客，但不喜標題前加-[轉貼]，因其丑陋，見諒！~

隨筆 - 1469, 文章 - 0, 評論 - 661, 引用 - 0

數(shù)據(jù)加載中……

兩個最容易被人忽略的基本代碼優(yōu)化技術

Dr. Dobb’s Blogger的Walter Bright曾寫了一篇博文《Overlooked Essentials For Optimizing Code》，為我們總結了兩個最容易被人忽略的基本代碼優(yōu)化技術。酷殼個人網(wǎng)站版主陳皓對本文進行了翻譯，現(xiàn)轉載于此，供大家學習。全文如下：

我編寫程序至今有35年了，我做了很多關于程序執(zhí)行速度方面優(yōu)化的工(一個示例)，我也看過其它人做的優(yōu)化。我發(fā)現(xiàn)有兩個最基本的優(yōu)化技術總是被人所忽略。

注意，這兩個技術并不是避免時機不成熟的優(yōu)化。并不是把冒泡排序變成快速排序（算法優(yōu)化）。也不是語言或是編譯器的優(yōu)化。也不是把 i*4寫成i<<2 的優(yōu)化。

這兩個技術是：

使用一個profiler。

查看程序執(zhí)行時的匯編碼。

使用這兩個技術的人將會成功地寫出運行快的代碼，不會使用這兩個技術的人則不行。下面讓我為你細細道來。

使用一個 Profiler

我們知道，程序運行時的90%的時間是用在了10%的代碼上。我發(fā)現(xiàn)這并不準確。一次又一次地，我發(fā)現(xiàn)，幾乎所有的程序會在1%的代碼上花了99%的運行時間。但是，是哪個1%？一個好的Profiler可以告訴你這個答案。就算我們需要使用100個小時在這1%的代碼上進行優(yōu)化，也比使用100個小時在其它99%的代碼上優(yōu)化產(chǎn)生的效益要高得多得多。

問題是什么？人們不用profiler？不是。我工作過的一個地方使用了一個華麗而奢侈的Profiler，但是自從購買這個Profiler后，它的包裝3年來還是那么的暫新。為什么人們不用？我真的不知道。有一次，我和我的同事去了一個負載過大的交易所，我同事堅持說他知道哪里是瓶頸，畢竟，他是一個很有經(jīng)驗的專家。最終，我把我的Profiler在他的項目上運行了一下，我們發(fā)現(xiàn)那個瓶頸完全在一個意想不到的地方。

就像是賽車一樣。團隊是贏在傳感器和日志上，這些東西提供了所有的一切。你可以調(diào)整一下賽車手的褲子以讓其在比賽過程中更舒服，但是這不會讓你贏得比賽，也不會讓你更有競爭力。如果你不知道你的速度上不去是因為引擎、排氣裝置、空體動力學、輪胎氣壓，或是賽車手，那么你將無法獲勝。編程為什么會不同呢？只要沒有測量，你就永遠無法進步。

這個世界上有太多可以使用的Profiler了。隨便找一個你就可以看到你的函數(shù)的調(diào)用層次，調(diào)用的次數(shù)，以前每條代碼的時間分解表（甚至可以到匯編級）。我看過太多的程序員回避使用Profiler，而是把時間花在那些無用的，錯誤的方向上的“優(yōu)化”，而被其競爭對手所羞辱。（譯者陳皓注：使用Profiler時，重點需要關注：1）花時間多的函數(shù)以優(yōu)化其算法，2）調(diào)用次數(shù)巨多的函數(shù)——如果一個函數(shù)每秒被調(diào)用300K次，你只需要優(yōu)化出0.001毫秒，那也是相當大的優(yōu)化。這就是作者所謂的1%的代碼占用了99%的CPU時間）

查看匯編代碼

幾年前，我有一個同事，Mary Bailey，她在華盛頓大學教矯正代數(shù)（remedial algebra），有一次，她在黑板上寫下：

x + 3 = 5

然后問他的學生“求解x”，然后學生們不知道答案。于是她寫下：

__ + 3 = 5

然后，再問學生“填空”，所有的學生都可以回答了。未知數(shù)x就像是一個有魔法的字母讓大家都在想“x意味著代數(shù)，而我沒有學過代數(shù)，所以我就不知道這個怎么做”。

匯編程序就是編程世界的代數(shù)。如果某人問我“inline函數(shù)是否被編譯器展開了？”或是問我“如果我寫下i*4，編譯器會把其優(yōu)化為左移位操作嗎？”。這個時候，我都會建議他們看看編譯器的匯編碼。這樣的回答是不是很粗暴和無用？通常，在我這樣回答了提問者后，提問都通常都會說，對不起，我不知道什么是匯編！甚至C++的專家都會這么回答。

匯編語言是最簡單的編程語言了（就算是和C++相比也是這樣的），如：

ADD ESI,x

就是（C風格的代碼）

ESI += x;

而：

CALL foo

則是：

foo();

細節(jié)因為CPU的種類而不同，但這就是其如何工作的。有時候，我們甚至都不需要細節(jié)，只需要看看匯編碼的長啥樣，然后和源代碼比一比，你就可以知道匯編代碼很多很多了。

那么，這又如何幫助代碼優(yōu)化？舉個例子，我?guī)啄昵罢J識一個程序員認為他應該去發(fā)現(xiàn)一個新的更快的算法。他有一個benchmark來證明這個算法，并且其寫了一篇非常漂亮的文章關于他的這個算法。但是，有人看了一下其原來算法以及新算法的匯編，發(fā)現(xiàn)了他的改進版本的算法允許其編譯器把兩個除法操作變成了一個。這和算法真的沒有什么關系。我們知道除法操作是一個很昂貴的操作，并且在其算法中，這倆個除法操作還在一個內(nèi)嵌循環(huán)中，所以，他的改進版的算法當然要快一些。但，只需要在原來的算法上做一點點小的改動——使用一個除法操作，那么其原來的算法將會和新的一樣快。而他的新發(fā)現(xiàn)什么也不是。

下一個例子，一個D用戶張貼了一個 benchmark 來顯示 dmd (Digital Mars D 編譯器)在整型算法上的很糟糕，而ldc (LLVM D 編譯器) 就好很多了。對于這樣的結果，其相當?shù)挠幸庖?。我迅速地看了一下匯編，發(fā)現(xiàn)兩個編譯器編譯出來相當?shù)囊恢?，并沒有什么明顯的東西要對2：1這么大的不同而負責。但是我們看到有一個對long型整數(shù)的除法，這個除法調(diào)用了運行庫。而這個庫成為消耗時間的殺手，其它所有的加減法都沒有速度上的影響。出乎意料地，benchmark 和算法代碼生成一點關系也沒有，完全就是long型整數(shù)的除法的問題。這暴露了在dmd的運行庫中的long型除法的實現(xiàn)很差。修正后就可以提高速度。所以，這和編譯器沒有什么關系，但是如果不看匯編，你將無法發(fā)現(xiàn)這一切。

查看匯編代碼經(jīng)常會給你一些意想不到的東西讓你知道為什么程序的性能是那樣。一些意想不到的函數(shù)調(diào)用，預料不到的自傲，以及不應該存在的東西，等等其實所有的一切。但也不需要成為一個匯編代碼的黑客才能干的事。

結論

如果你覺得需要程序有更好的執(zhí)行速度，那么，最基本的方法就是使用一個profiler和愿意去查看一下其匯編代碼以找到程序的瓶頸。只有找到了程序的瓶頸，此時才是真正在思考如何去改進的時候，比如思考一個更好的算法，使用更快的語言優(yōu)化，等等。

常規(guī)的做法是制勝法寶是挑選一個最佳的算法而不是進行微優(yōu)化。雖然這種做法是無可異議的，但是有兩件事情是學校沒有教給你而需要你重點注意的。第一個也是最重要的，如果你優(yōu)化的算法沒沒有參與到你程序性能中的算法，那么你優(yōu)化他只是在浪費時間和精力，并且還轉移了你的注意力讓你錯過了應該要去優(yōu)化的部分。第二點，算法的性能總和處理的數(shù)據(jù)密切相關的，就算是冒泡排序有那么多的笑柄，但是如果其處理的數(shù)據(jù)基本是排好序的，只有其中幾個數(shù)據(jù)是未排序的，那么冒泡排序也是所有排序算法里性能最好的。所以，擔心沒有使用好的算法而不去測量，只會浪費時間，無論是你的還是計算機的。

就好像賽車零件的訂購速底是不會讓你更靠進冠軍（就算是你正確安裝零件也不會），沒有Profiler，你不會知道問題在哪里，不去看匯編，你可能知道問題所在，但你往往不知道為什么。

原文鏈接：Overlooked Essentials For Optimizing Code

譯文鏈接：http://coolshell.cn/articles/2967.html

posted on 2010-09-24 10:15 肥仔閱讀(789) 評論(1) 編輯收藏引用所屬分類: 其他經(jīng)驗

# re: 兩個最容易被人忽略的基本代碼優(yōu)化技術 回復 更多評論

學習了

2010-10-24 09:19 | shiweifu

刷新評論列表

只有注冊用戶登錄后才能發(fā)表評論。
【推薦】100%開源！大型工業(yè)跨平臺軟件C++源碼提供，建模，組態(tài)！

相關文章: Advanced Installer漢化版教程寫號的基本常識電信卡UIM卡相關技術資料遠程桌面 - 單用戶登錄 – 【W(wǎng)indows 2003】 Word項目符號和編號對齊的問題 outlook查看text format郵件時，會把1個"\r\n”刪除，但是保留多個"\r\n” 兩個最容易被人忽略的基本代碼優(yōu)化技術世界時區(qū)及時差計算 Excel技巧之按顏色排序或篩選微軟下一代操作系統(tǒng)Windows 8將只有64位版

網(wǎng)站導航: 博客園 IT新聞 BlogJava 博問 Chat2DB 管理

# re: 兩個最容易被人忽略的基本代碼優(yōu)化技術 回復 更多評論

woaidongmao

兩個最容易被人忽略的基本代碼優(yōu)化技術

評論

導航

常用鏈接

留言簿(10)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜

woaidongmao

兩個最容易被人忽略的基本代碼優(yōu)化技術

評論

# re: 兩個最容易被人忽略的基本代碼優(yōu)化技術 回復 更多評論

導航

常用鏈接

留言簿(10)

隨筆分類

隨筆檔案

搜索

最新評論

閱讀排行榜

評論排行榜

# re: 兩個最容易被人忽略的基本代碼優(yōu)化技術回復更多評論