青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

BillyYu

算法的力量

算法的力量
2006年5月

算法是計算機科學領域最重要的基石之一,但卻受到了國內一些程序員的冷落。許多學生看到一些公司在招聘時要求的編程語言五花八門,就產生了一種誤解,認為學計算機就是學各種編程語言,或者認為,學習最新的語言、技術、標準就是最好的鋪路方法。其實,大家被這些公司誤導了。編程語言雖然該學,但是學習計算機算法和理論更重要,因為計算機語言和開發平臺日新月異,但萬變不離其宗的是那些算法和理論,例如數據結構、算法、編譯原理、計算機體系結構、關系型數據庫原理等等。在“開復學生網”上,有位同學生動地把這些基礎課程比擬為“內功”,把新的語言、技術、標準比擬為“外功”。整天趕時髦的人最后只懂得招式,沒有功力,是不可能成為高手的。

算法與我

當我在1980年轉入計算機科學系時,還沒有多少人的專業方向是計算機科學。有許多其他系的人嘲笑我們說:“知道為什么只有你們系要加一個‘科學’,而沒有‘物理科學系’或‘化學科學系’嗎?因為人家是真的科學,不需要畫蛇添足,而你們自己心虛,生怕不‘科學’,才這樣欲蓋彌彰。” 其實,這點他們徹底弄錯了。真正學懂計算機的人(不只是“編程匠”)都對數學有相當的造詣,既能用科學家的嚴謹思維來求證,也能用工程師的務實手段來解決問題——而這種思維和手段的最佳演繹就是“算法”。

記得我讀博時寫的Othello對弈軟件獲得了世界冠軍。當時,得第二名的人認為我是靠僥幸才打贏他,不服氣地問我的程序平均每秒能搜索多少步棋,當他發現我的軟件在搜索效率上比他快60多倍時,才徹底服輸。為什么在同樣的機器上,我可以多做60倍的工作呢?這是因為我用了一個最新的算法,能夠把一個指數函數轉換成四個近似的表,只要用常數時間就可得到近似的答案。在這個例子中,是否用對算法才是能否贏得世界冠軍的關鍵。

還記得1988年貝爾實驗室副總裁親自來訪問我的學校,目的就是為了想了解為什么他們的語音識別系統比我開發的慢幾十倍,而且,在擴大至大詞匯系統后,速度差異更有幾百倍之多。他們雖然買了幾臺超級計算機,勉強讓系統跑了起來,但這么貴的計算資源讓他們的產品部門很反感,因為“昂貴”的技術是沒有應用前景的。在與他們探討的過程中,我驚訝地發現一個O(n*m)的動態規劃(dynamic programming)居然被他們做成了O(n*n*m)。更驚訝的是,他們還為此發表了不少文章,甚至為自己的算法起了一個很特別的名字,并將算法提名到一個科學會議里,希望能得到大獎。當時,貝爾實驗室的研究員當然絕頂聰明,但他們全都是學數學、物理或電機出身,從未學過計算機科學或算法,才犯了這么基本的錯誤。我想那些人以后再也不會嘲笑學計算機科學的人了吧!

網絡時代的算法

有人也許會說:“今天計算機這么快,算法還重要嗎?”其實永遠不會有太快的計算機,因為我們總會想出新的應用。雖然在摩爾定律的作用下,計算機的計算能力每年都在飛快增長,價格也在不斷下降。可我們不要忘記,需要處理的信息量更是呈指數級的增長。現在每人每天都會創造出大量數據(照片,視頻,語音,文本等等)。日益先進的記錄和存儲手段使我們每個人的信息量都在爆炸式的增長。互聯網的信息流量和日志容量也在飛快增長。在科學研究方面,隨著研究手段的進步,數據量更是達到了前所未有的程度。無論是三維圖形、海量數據處理、機器學習、語音識別,都需要極大的計算量。在網絡時代,越來越多的挑戰需要靠卓越的算法來解決。

再舉另一個網絡時代的例子。在互聯網和手機搜索上,如果要找附近的咖啡店,那么搜索引擎該怎么處理這個請求呢?

最簡單的辦法就是把整個城市的咖啡館都找出來,然后計算出它們的所在位置與你之間的距離,再進行排序,然后返回最近的結果。但該如何計算距離呢?圖論里有不少算法可以解決這個問題。

這么做也許是最直觀的,但絕對不是最迅速的。如果一個城市只有為數不多的咖啡館,那這么做應該沒什么問題,反正計算量不大。但如果一個城市里有很多咖啡館,又有很多用戶都需要類似的搜索,那么服務器所承受的壓力就大多了。在這種情況下,我們該怎樣優化算法呢?

首先,我們可以把整個城市的咖啡館做一次“預處理”。比如,把一個城市分成若干個“格子(grid)”,然后根據用戶所在的位置把他放到某一個格子里,只對格子里的咖啡館進行距離排序。

問題又來了,如果格子大小一樣,那么絕大多數結果都可能出現在市中心的一個格子里,而郊區的格子里只有極少的結果。在這種情況下,我們應該把市中心多分出幾個格子。更進一步,格子應該是一個“樹結構”,最頂層是一個大格——整個城市,然后逐層下降,格子越來越小,這樣有利于用戶進行精確搜索——如果在最底層的格子里搜索結果不多,用戶可以逐級上升,放大搜索范圍。

上述算法對咖啡館的例子很實用,但是它具有通用性嗎?答案是否定的。把咖啡館抽象一下,它是一個“點”,如果要搜索一個“面”該怎么辦呢?比如,用戶想去一個水庫玩,而一個水庫有好幾個入口,那么哪一個離用戶最近呢?這個時候,上述“樹結構”就要改成“r-tree”,因為樹中間的每一個節點都是一個范圍,一個有邊界的范圍(參考:http://www.cs.umd.edu/~hjs/rtrees/index.html)。

通過這個小例子,我們看到,應用程序的要求千變萬化,很多時候需要把一個復雜的問題分解成若干簡單的小問題,然后再選用合適的算法和數據結構。

并行算法:Google的核心優勢

上面的例子在Google里就要算是小case了!每天Google的網站要處理十億個以上的搜索,GMail要儲存幾千萬用戶的2G郵箱,Google Earth要讓數十萬用戶同時在整個地球上遨游,并將合適的圖片經過互聯網提交給每個用戶。如果沒有好的算法,這些應用都無法成為現實。

在這些的應用中,哪怕是最基本的問題都會給傳統的計算帶來很大的挑戰。例如,每天都有十億以上的用戶訪問Google的網站,使用Google的服務,也產生很多很多的日志(Log)。因為Log每分每秒都在飛速增加,我們必須有聰明的辦法來進行處理。我曾經在面試中問過關于如何對log進行一些分析處理的問題,有很多面試者的回答雖然在邏輯上正確,但在實際應用中是幾乎不可行的。按照他們的算法,即便用上幾萬臺機器,我們的處理速度都跟不上數據產生的速度。

那么Google是如何解決這些問題的呢?

首先,在網絡時代,就算有最好的算法,也要能在并行計算的環境下執行。在Google的數據中心,我們使用的是超大的并行計算機。但傳統的并行算法運行時,效率會在增加機器數量后迅速降低,也就是說,十臺機器如果有五倍的效果,增加到一千臺時也許就只有幾十倍的效果。這種事倍功半的代價是沒有哪家公司可以負擔得起的。而且,在許多并行算法中,只要一個結點犯錯誤,所有計算都會前功盡棄。

那么Google是如何開發出既有效率又能容錯的并行計算的呢?

Google最資深的計算機科學家Jeff Dean認識到, Google 所需的絕大部分數據處理都可以歸結為一個簡單的并行算法:Map and Reduce(http://labs.google.com/papers/mapreduce.html)。 這個算法能夠在很多種計算中達到相當高的效率,而且是可擴展的(也就是說,一千臺機器就算不能達到一千倍的效果,至少也可以達到幾百倍的效果)。Map and Reduce的另外一大特色是它可以利用大批廉價的機器組成功能強大的server farm。最后,它的容錯性能異常出色,就算一個server farm里面的機器down掉一半,整個farm依然能夠運行。正是因為這個天才的認識,才有了Map and Reduce算法。借助該算法,Google幾乎能無限地增加計算量,與日新月異的互聯網應用一同成長。

算法并不局限于計算機和網絡

舉一個計算機領域外的例子:在高能物理研究方面,很多實驗每秒鐘都產生幾個TB的數據量。但因為處理能力和存儲能力的不足,科學家不得不把絕大部分未經處理的數據丟棄掉。可大家要知道,新元素的信息很有可能就藏在我們來不及處理的數據里面。同樣的,在其他任何領域里,算法都可以改變人類的生活。例如人類基因的研究,就可能因為算法而發明新的醫療方式。在國家安全領域,有效的算法可能避免下一個911的發生。在氣象方面,算法可以更好地預測未來天災的發生,以拯救生命。

所以,如果你把計算機的發展放到應用和數據飛速增長的大環境下,你一定會發現,算法的重要性不是在日益減小,而是在日益加強。

給程序員的七個建議

(1)練內功。不要只花功夫學習各種流行的編程語言和工具,以及某些公司招聘廣告上要求的科目。要把數據結構、算法、數據庫、操作系統原理、計算機體系結構、計算機網絡,離散數學等基礎課程學好。大家不妨試試高德納所著The Art of Computer Programming里的題目,如果你能夠解決其中的大部分題目,就說明你在算法方面有一定的功力了。

(2)多實戰。通過編程的實戰積累經驗、鞏固知識。很多中國大學畢業生缺乏編程和調試經驗;學習C語言,考試過關就算學會了;課題項目中,只要程序能夠編譯,運行,并且輸入輸出滿足要求就算了事。這些做法是不行的。寫程序的時候,大家必須多想想如何把程序寫得更加精煉、高效、高質量。建議大家爭取在大學四年中積累編寫十萬行代碼的經驗。我們必須明白的是:好程序員是寫出來的,不是學出來的。

(3)求實干。不要輕視任何實際工作,比如一些看似簡單的編碼或測試。要不懈追求對細節一絲不茍的實干作風與敬業精神。我發現不少程序員對于知識的掌握很膚淺,不求甚解,沒有好奇心,不會刨根問底。比如,學會了C++,是否了解一個對象在編譯后,在匯編代碼中是如何被初始化的?這個對象的各個成員在內存中是如何存放的?當一個成員函數被調用時,編譯器在匯編代碼中加入了哪些額外的動作?虛函數的調用是如何實現的? 這些東西恐怕在編程語言或編譯原理中都沒有詳細提到,只有通過踏實的實干才能真正掌握。

(4)重視數學學習。數學是思維的體操,數學無處不在。學計算機至少要學習離散數學、概率論、布爾代數、集合論和數理邏輯。這些知識并不難,但是對你未來的工作幫助會很大。 尤其當你對一些“數學密集型”的領域如視頻、圖像處理等有興趣時,這些知識將成為你手中的利器。

(5)培養團隊精神,學會與人合作。今天的軟件工程早已經不是一個人可以單獨操作的,而必須靠團隊合作才能成功。不懂得合作的人是不能成大器的。大家要多去尋找可以與人一起做項目的機會。

(6)激勵創新意識,培養好奇心,不要死記硬背。沒有掌握某種算法技術的根本原理,就不會有應變和創新的能力。想成為一位好程序員(其實從事任何一個行業都是如此),重要的是要養成鉆研,好奇,創新,動手,合作的優秀習慣,不滿足于填鴨,不滿足于考試交差,不滿足于表象。這不是學幾門課能夠一蹴而就的。

(7)有策略地“打工”。在不影響學業的前提下,尋找真正有意義的暑期工作或兼職。去找一個重視技術的公司,在一個好的“老板”指導下完成真正會被用戶使用的程序。不要急于去一個要你做“頭”而獨擋一面的地方,因為向別人學習才是你的目的。找工作也是一樣,不要只看待遇和職銜,要挑一個你能夠學習的環境,一個愿意培養員工的企業,一個重視你的專業的公司。最后,還要挑一個好老板。

希望大家都能把握機會,養成好的學習習慣,把算法學精學透;希望大家都能有一個美好的未來! 

posted on 2008-04-19 12:49 志華 閱讀(199) 評論(0)  編輯 收藏 引用


只有注冊用戶登錄后才能發表評論。
網站導航: 博客園   IT新聞   BlogJava   博問   Chat2DB   管理


<2010年12月>
2829301234
567891011
12131415161718
19202122232425
2627282930311
2345678

導航

統計

常用鏈接

留言簿(1)

隨筆分類

隨筆檔案

文章檔案

搜索

最新評論

閱讀排行榜

評論排行榜

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品
  • <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            欧美国产精品日韩| 久久免费视频在线观看| 亚洲第一福利视频| 亚洲综合色自拍一区| 日韩一级不卡| 另类图片国产| 久久五月天婷婷| 国产精品视频福利| 夜夜夜精品看看| 99re热这里只有精品视频| 久久久99久久精品女同性| 午夜老司机精品| 欧美日韩在线播放三区四区| 亚洲第一区在线| 精品va天堂亚洲国产| 午夜精品剧场| 亚洲男人影院| 国产精品视频精品视频| 一区二区三区久久久| 亚洲最新视频在线| 欧美区日韩区| 日韩视频免费观看高清在线视频 | 欧美亚韩一区| 亚洲精品免费在线播放| 亚洲精品午夜精品| 欧美高清视频一区| 亚洲国产精品精华液网站| 在线播放亚洲一区| 久久一日本道色综合久久| 久久久蜜桃一区二区人| 国产亚洲一区二区三区在线观看 | 欧美日韩一区二区三区在线看 | 一区二区日韩免费看| 日韩视频免费观看高清完整版| 久久一区精品| 欧美国产日本韩| 日韩一区二区精品视频| 欧美片第1页综合| 99国产精品视频免费观看| 亚洲自拍偷拍网址| 国产欧美日韩一区二区三区| 久久成人18免费网站| 美女国产一区| 亚洲另类一区二区| 欧美午夜片在线免费观看| 亚洲夜间福利| 蜜臀av性久久久久蜜臀aⅴ| 91久久线看在观草草青青| 欧美激情片在线观看| 中文有码久久| 免费成人在线视频网站| 亚洲美女毛片| 国产欧美一区二区精品仙草咪 | 国产一区二区三区久久久| 久久精品欧美日韩| 91久久久一线二线三线品牌| 亚洲一区影院| 伊人久久男人天堂| 欧美日韩调教| 久久久国产精品一区二区中文| 亚洲国产精品久久久久秋霞影院 | 欧美日韩亚洲一区二区三区四区| 亚洲一区二区久久| 蜜臀av性久久久久蜜臀aⅴ四虎| 99热在线精品观看| 国产欧美日韩一区二区三区在线| 久久免费偷拍视频| 中日韩午夜理伦电影免费| 麻豆国产精品va在线观看不卡| 一区二区欧美在线| 一区二区视频欧美| 国产精品二区在线| 欧美成人高清视频| 欧美亚洲免费电影| 日韩亚洲成人av在线| 久久中文字幕导航| 羞羞视频在线观看欧美| 亚洲精品裸体| 一区二区三区在线免费视频 | 激情综合在线| 国产精品久久久久毛片软件 | 亚洲第一页自拍| 国产精品中文字幕在线观看| 欧美电影在线观看完整版| 欧美与黑人午夜性猛交久久久| 日韩亚洲欧美高清| 亚洲大胆视频| 欧美肥婆在线| 美女视频网站黄色亚洲| 欧美在线观看一区二区| 亚洲视频axxx| 亚洲日本视频| 亚洲国产一二三| 极品日韩久久| 黄色日韩网站| 国产自产女人91一区在线观看| 国产精品久久久久国产a级| 欧美成人亚洲成人| 老司机久久99久久精品播放免费| 欧美在线视频一区二区三区| 亚洲视频免费观看| 宅男精品视频| 亚洲素人在线| 亚洲一级免费视频| 亚洲一区二区精品视频| 一区二区三区视频在线播放| 亚洲精品一二三区| 亚洲欧洲一区二区三区| 亚洲激情图片小说视频| 欧美激情一区在线观看| 亚洲第一福利社区| 最新国产の精品合集bt伙计| 亚洲第一色在线| 亚洲区欧美区| 艳女tv在线观看国产一区| 一区二区欧美日韩| 一区二区三区四区五区视频| 99热在线精品观看| 亚洲午夜精品一区二区| 性欧美videos另类喷潮| 久久国产精彩视频| 久久影视精品| 欧美日韩福利视频| 国产精品白丝av嫩草影院 | 国产婷婷一区二区| 国产一区二区三区av电影| 永久免费精品影视网站| 亚洲国产一区二区在线| 一区二区高清视频在线观看| 在线视频欧美一区| 欧美一区二区视频观看视频| 久久久人成影片一区二区三区| 欧美jjzz| 99一区二区| 先锋亚洲精品| 欧美刺激性大交免费视频| 欧美日韩一区二区三区在线| 国产精品嫩草影院一区二区| 国产在线欧美日韩| 亚洲成人在线网| 亚洲桃花岛网站| 狂野欧美激情性xxxx| 亚洲娇小video精品| 亚洲综合精品自拍| 麻豆91精品91久久久的内涵| 欧美丝袜第一区| 激情成人中文字幕| 亚洲无吗在线| 久热精品视频在线观看| 亚洲人午夜精品免费| 午夜免费久久久久| 欧美大片在线看| 国产午夜精品美女毛片视频| 亚洲美女91| 久久九九国产精品怡红院| 亚洲精品久久7777| 久久久久国色av免费观看性色| 欧美伦理91i| 韩国一区二区三区美女美女秀| 亚洲最新在线| 欧美成人在线影院| 欧美一区二区三区精品| 欧美视频在线观看| 亚洲国产激情| 久久久不卡网国产精品一区| 99精品99| 欧美激情一区二区三区在线视频观看| 国产毛片久久| 亚洲一级电影| 亚洲精品国产无天堂网2021| 久久久久亚洲综合| 国产嫩草一区二区三区在线观看| 一本综合精品| 亚洲第一级黄色片| 久久久综合免费视频| 国产欧美一区二区在线观看| 一区二区日韩精品| 亚洲国产精品一区二区尤物区| 久久久久久久一区二区三区| 国产乱肥老妇国产一区二| 一区二区毛片| 亚洲精品国产精品久久清纯直播| 久久精品国语| 狠狠色噜噜狠狠色综合久| 欧美在线播放一区二区| 亚洲一区三区在线观看| 国产精品大片免费观看| 亚洲午夜精品| 亚洲色图制服丝袜| 欧美三级韩国三级日本三斤| 一区二区免费在线播放| 91久久综合亚洲鲁鲁五月天| 欧美不卡三区| 日韩一级大片在线| 亚洲美女尤物影院| 欧美日韩综合久久| 亚洲一区二区三区成人在线视频精品| 亚洲乱码国产乱码精品精天堂| 欧美日韩国产色站一区二区三区| 99精品久久|