計算基礎(chǔ)正在發(fā)生根本變革——解讀“計算2.0”
摘自CSND 作者:孟巖
從本質(zhì)上看,軟件實際上只是夾在人與硬件之間的一個中間層,人們使用軟件的根本目的還是要讓硬件運轉(zhuǎn)起來為自己服務(wù)。硬件平臺如果長期穩(wěn)定,軟件就能夠安穩(wěn)發(fā)展,建起高樓大廈,硬件基礎(chǔ)如果打個噴嚏,軟件就會得一場感冒。過去十幾年來,我們的計算環(huán)境已經(jīng)發(fā)生了很多變化,比如RISC的興起,大規(guī)模服務(wù)器集群的發(fā)展,SIMD的普及,特別是網(wǎng)絡(luò)的大發(fā)展,令人印象深刻。每一項變化都給軟件帶來一定程度的沖擊。不過大部分情況下,這種沖擊力度有限:只需要有一小部分人去關(guān)注就好了,他們會盡可能把這些變化包裝起來,從而使得其余的絕大部分人不受影響,而又能夠享受硬件發(fā)展帶來的免費午餐。比如說,RISC跟硬件平臺帶來的變革是非常巨大的,但是只有編譯器和操作系統(tǒng)開發(fā)者真正需要關(guān)注它。SIMD(MMX、3DNow!、SSEx)的發(fā)展使普通計算機處理多媒體數(shù)據(jù)的能力獲得了本質(zhì)提升,但是廠商們也推出了一系列封裝庫,使應(yīng)用軟件開發(fā)者們在不需對開發(fā)方式做重大改變的情況下享受這些發(fā)展成果。
然而站在今天這個時間點上往前看,就會看到,情況在發(fā)生的變化。發(fā)生在若干個不同領(lǐng)域的硬件進展,幾乎在同時達到了可以被稱之為“本質(zhì)變化”的狀態(tài)。而所有這些變化結(jié)合起來,則使我們面對一個自1980年代初PC崛起以來從來沒有過的局面,一個可以毫不夸張地稱之為“變革”的局面,我們稱之為“計算
下面就讓我們一起來展望一下“計算
1. 多核與并發(fā)編程
自從2005年初C++標(biāo)準(zhǔn)委員會主席Herb Sutter發(fā)表《并發(fā)的革命——免費午餐已經(jīng)結(jié)束》的著名文章以來,多核已經(jīng)成為整個軟件社群里熱門話題。在那篇文章里,Herb Sutter斷言說,CPU頻率的提高已經(jīng)接近極限,摩爾定律的發(fā)展今后將依賴多核化進行下去,因此,軟件若要在未來的環(huán)境下生存,必須考慮并發(fā)問題。接著,Herb Sutter做出了更大膽和更驚人的語言,那就是不存在解決多核編程問題的銀彈,不存在可以簡單地將并發(fā)編程問題化解掉的工具,開發(fā)高性能的并行程序必須要求開發(fā)者從根本上改變其編程方法。從某種意義上來說,這不僅僅是要改變50年來順序程序設(shè)計的工藝傳統(tǒng),而且是要改變數(shù)百萬年來人類順序化思考問題的習(xí)慣,其困難程度可想而知!
將近3年后的今天,Herb Sutter的預(yù)言似乎初步得到了印證。單核機器現(xiàn)在已經(jīng)成了過時貨,并且很快就會加入古董的行列。而多核機器的價格正在迅速下降。如今花2萬塊錢人民幣,可以買下“三個8”的刀片服務(wù)器——兩個4核至強+
人們正在緊張地尋找著解決多核編程難題的方法。到目前為止,進展不太大。目前最理想的結(jié)果,就是類似Intel C++和Intel Fortran這樣的編譯器,可以自動識別可并行化的循環(huán)運算,然后實施自動并行化。但是這距離全面并發(fā)還很遙遠。類似MPI和OpenMP這樣的解決方案雖然早就存在,但是要得到普及難度不小。至于其他的一些常規(guī)方案,無非是優(yōu)化多線程中的一些問題,比如無鎖數(shù)據(jù)結(jié)構(gòu)嘗試避免加鎖和解鎖帶來的巨大開銷,而事務(wù)型內(nèi)存也是為了優(yōu)化多線程程序共享資源的性能和可靠性。專門為并發(fā)系統(tǒng)設(shè)計的語言Erlang,被很多人視為多核時代的Java,但是Erlang的長項在于并發(fā)任務(wù)的分發(fā)和同步,用它來處理計算密集型的任務(wù),如圖形圖像多媒體處理和數(shù)值計算,效率之低令人無法接受。也許把Erlang當(dāng)成計算的dispatcher,而讓每個核上都繼續(xù)以傳統(tǒng)的單線程方式運行C程序是解決這類問題的辦法。但是所有這些方法,都首先要求將任務(wù)分解成可同時并行的多個單元,并且將并行計算中的若干問題定義清楚。也就是說,這些方法都無法解決那個最大的挑戰(zhàn):人的思維方式轉(zhuǎn)變問題。不改變我們編寫應(yīng)用程序的傳統(tǒng)線性思維,所有這些工具都沒有太大幫助。毫無疑問,這是擺在我們面前的最大難題之一。
2. 新計算設(shè)備
寫作此文時,Amazon剛剛發(fā)布了電子書閱讀器Kindle,這款產(chǎn)品的出現(xiàn),基本上等于宣告電子閱讀時代的降臨,它所將引起的沖擊必將是劃時代的。然而對于開發(fā)者來說,它卻只不過是在一個已經(jīng)很長的新計算設(shè)備名單里又加上了一項。這個名單中包括:PS2/3,XBox/XBox360,Wii, Tivo,Game Boy、Game Boy Advance,PSP,iPhone,Windows Mobile,Symbian,Linux Mobile,Blackberry,iPod,車載導(dǎo)航儀,當(dāng)然,還有最最激動人心的機器人。有人大而化之將它們統(tǒng)稱為“嵌入式設(shè)備”,然而這是一個非常具有誤導(dǎo)性的說法,這些設(shè)備中的每一項都不是傳統(tǒng)意義上的“嵌入式設(shè)備”,而是更接近于計算機的通用計算設(shè)備,更確切的說法應(yīng)該是“專用的通用計算設(shè)備”。
僅僅十幾年以前,我們可以安全地認為,世界上每臺計算機都是PC,每臺PC都用X86 CPU,都安裝了DOS/Windows。隨著最近幾年來新的計算設(shè)備如雨后春筍般涌現(xiàn),PC包打天下的時代已經(jīng)一去不返,這一點已經(jīng)非常清楚不過了。
然而,軟件開發(fā)者并沒有從過去20多年形成的單一平臺迷思中擺脫出來。在軟件系統(tǒng)開發(fā)中合理運用多平臺特長,充分注重可移植性的思維尚未形成,大部分應(yīng)用還是為傳統(tǒng)PC平臺開發(fā)的。這一點顯然已經(jīng)落后于時代的發(fā)展。當(dāng)然,這也就給那些有識之士提供了難得的機遇,充分利用多平臺整合的優(yōu)勢,就可以開發(fā)出革命性的新型應(yīng)用。
3. GPGPU
“CPU——中心處理單元,計算機的核心和大腦,一切的一切的主宰。”
教科書上這么告訴我們。
很遺憾,這種說法早就不是事實了。自從類似DMA這樣的技術(shù)出現(xiàn),CPU就在不斷地“減負”。事實上一臺計算機里有許多塊不同的芯片,它們各自有各自的絕活,讓整臺計算機高速運轉(zhuǎn)。不過,不管怎么說,CPU還是整臺電腦里最強有力的中心,它最強大,最能干。對嗎?
很遺憾,連這個說法也變得非常脆弱了。在那些裝備有高級圖形卡的電腦玩家的機器中,CPU已經(jīng)不是最強大的計算單元了,取而代之的是GPU。
GPU原本只是為了進行3D圖形加速而誕生的芯片,由于其專用性,體系結(jié)構(gòu)較之CPU大大簡化,從而可以高度優(yōu)化設(shè)計,進行大規(guī)模的浮點數(shù)并行計算。當(dāng)代GPU在這方面的性能遠遠超過了CPU。在浮點數(shù)計算速度上,NVIDIA最新的GPU超過Intel最快的CPU達10倍以上,而據(jù)稱,這一差距在未來幾年內(nèi)會達到數(shù)百倍。單就這一點來說,GPU早就是計算機中最快的芯片了。
然而,由于GPU的專用性,大部分通用計算任務(wù)是無法用GPU來完成的。例如,連最最簡單的分支語句,GPU都無法完成。因此,GPU永遠不可能取代CPU。但是,GPU強大的計算能力如果僅僅給高性能圖形程序和游戲來使用,也無疑是一種巨大的計算資源浪費,有沒有可能將GPU的計算資源暴露給應(yīng)用程序員,由他們將適合于GPU計算的任務(wù)轉(zhuǎn)交給GPU完成,而把CPU解放出來干CPU擅長的工作呢?沒錯,這就是通用GPU計算(General Purpose GPU computing)的宗旨。
眼下,NVIDIA和AMD(不久前收購ATI)都在加速推出對GPGPU開發(fā)的支持,而據(jù)傳Intel也將在2008年推出自己的獨立顯卡,加入戰(zhàn)局。這也就意味著,不出幾年,每臺電腦里都會存在兩個強大的計算單元,一個是CPU,一個是GPU。軟件開發(fā)人員將面臨新的挑戰(zhàn)——只有把任務(wù)合理地分配給CPU和GPU,并且進行統(tǒng)一調(diào)度,才能夠達到效率上的最佳化。此外,那時候的CPU有8個或更多的核,而GPU本身更是高度并行化的計算單元,計算任務(wù)不僅要合理分布,還需要充分并行,這其中蘊含的挑戰(zhàn)之大,足夠令人心驚膽寒。然而,也正正創(chuàng)造了英雄橫空出世的條件,誰能夠橫刀立馬,誰就能功成名就。
4. 無處不在的網(wǎng)絡(luò)
回到Kindle,這個產(chǎn)品最有趣的部分在于,你可以隨時通過無線網(wǎng)絡(luò)下載你想看的書,而且這些下載的書被保存在網(wǎng)絡(luò)上你的一個私人空間里。你永遠不會買不到想要的書,也永遠不用擔(dān)心家里太小,放不下這些書。如果你的Kindle丟失了或者你想換一臺,沒關(guān)系,你龐大的圖書館會毫發(fā)無損。
你覺得怎么樣?非常好,對嗎?但這需要一個條件,一個重要的條件——無所不在的網(wǎng)絡(luò),特別的,無所不在的無線網(wǎng)絡(luò)。
不出幾年,將不會再存在Internet的死角,在任何地方你都可以高速訪問Internet。對軟件開發(fā)者來說這意味著什么?這意味著很多過去慣用的軟件設(shè)計思路將不再是最優(yōu)的了,關(guān)于網(wǎng)絡(luò)訪問限制的很多擔(dān)憂也變得不必要了。應(yīng)用可以保證永遠連網(wǎng),用戶數(shù)據(jù)也最好保存在網(wǎng)絡(luò)上,密集的計算任務(wù)交給網(wǎng)絡(luò)上的高速節(jié)點來執(zhí)行,可能比本地執(zhí)行更快。一言以蔽之,網(wǎng)絡(luò)計算將全面取代單機計算,無論是對PC來說,還是對各種各樣的小設(shè)備來說。
更重大的變化可能來自人們的生活方式,當(dāng)互聯(lián)網(wǎng)——這個目前世界上規(guī)模最大、最自由的網(wǎng)絡(luò)——無處不在并且速度飛快的時候,其他的通信網(wǎng)絡(luò)還有存在的必要嗎?我們還需要使用中國移動的專有網(wǎng)絡(luò)并且每個月為之付出不菲的費用嗎?我們還需要忍受諸如“腦白金”那樣的爛廣告和矯揉造作的爛主持人嗎?我們還需要買日報和雜志嗎?可能都不需要了。互聯(lián)網(wǎng)就是電視,互聯(lián)網(wǎng)就是電話,互聯(lián)網(wǎng)就是報紙,一切媒體歸于互聯(lián)網(wǎng)。這種局面會給人類的生存方式帶來一個重大的變革,在其中蘊含著巨大機會、挑戰(zhàn)和財富。在這個意義上,Google的成功只不過是一個序曲而已。
如上所述,相信您已經(jīng)意識到我們處在一個怎樣的變革當(dāng)中!令我們興奮不已的是,軟件開發(fā)者在這個變革中處于前鋒的位置,我們準(zhǔn)備好了嗎?
在多核CPU上的多線程并行程序設(shè)計,究竟應(yīng)該被稱為“并行(parallel)”還是“并發(fā)(concurrency)”,并沒有統(tǒng)一的認識。通常將“并行”定義為在多個計算單元上同時執(zhí)行多個任務(wù),而將“并發(fā)”定義為在單個計算單元上以分時的方式“同時”執(zhí)行多個任務(wù),由于多核CPU有多個計算單元,因此似乎成為“并行”更加合適。但又因為單個多核CPU對外只表現(xiàn)為一個計算單元,因此似乎“并發(fā)”也很合適。對這個問題缺乏統(tǒng)一的認識。從軟件開發(fā)上來看,無論是否執(zhí)行在多個核上,編程方法本身必須發(fā)生變化,這種變化了的編程方法通常被稱為“并發(fā)編程”,表明這樣方式編寫的程序既可以跑在多個計算單元上,也可以以分時的方式執(zhí)行在一個計算單元上。