過度使用C++模板(overdoing C++ templates)
作者:Steve Donovan.
翻譯:
Winter
原文:
Overdoing C++ Templates
大約每隔十年,都會出現(xiàn)一個編程新概念,宣布自己是以往概念的繼承者。我們也再一次相信,從今往后軟件比以前更可靠,更容易build,或者更有意思(沒
有人相信它會比以前更小或者更快)。在70年代,有結(jié)構(gòu)編程;在80年代,開始了面向?qū)ο缶幊?;?0年代中期,出現(xiàn)了范型編程(generic
programming)。范型編程得名于其用模板而使代碼重用的高效技術(shù)(范型類和范型函數(shù))。
模板類和模板函數(shù)都是非常有用的工具。例如sqr()函數(shù)可以計算平方數(shù),任何定義了乘法運算的數(shù)據(jù)類型(數(shù)字,矩陣)都適用。標(biāo)準(zhǔn)容器類(如
list)都是模板,這樣對于每個新類型無需重寫了,這正是使用舊版的C++時真正頭疼的事情,因此我認(rèn)為ISO的標(biāo)準(zhǔn)是個偉大的進步。然而,在這個過程
中有些東西用得過頭了。
例如:標(biāo)準(zhǔn)庫中得string 和iostream 都是使用"character
traits"類型作為參數(shù)。這意味著同一個basic_string<>類可以用于ASCII字符串,也可用于Unicode,甚至用于火
星人的三字節(jié)字符串(原則雖然如此,但許多版本都只是實現(xiàn)了ASCII字符串,看起來有點滑稽)。標(biāo)準(zhǔn)要求這些常用類必須實現(xiàn)成模板形式,而這些類幾乎涉
及到所有C++應(yīng)用。
但是這對性能和調(diào)試會帶來許多麻煩。下面幾個試驗解釋了這個問題(本試驗使用的編譯器為VC++6.0)。編譯器同時支持新風(fēng)格的
iostream(使用模板)和經(jīng)典風(fēng)格的iostream, 因此我們能比較他們二者的版本實現(xiàn)。第一個測試程序當(dāng)然是使用"Hello,
Word"了,新風(fēng)格的編譯時間是經(jīng)典風(fēng)格的2倍。另一個更正規(guī)的例子大約有200行,每行輸出10個變量用于計數(shù)。這個測試程序最顯著的結(jié)論是編譯速
度:新風(fēng)格版本花了10秒編譯完成,而舊版本只使用了1.5秒。10秒時間可并不少,可以完成很多事情。另外,新風(fēng)格版本的可執(zhí)行文件的大小為115K,
而舊版本只有70K。你的測試數(shù)據(jù)可能有些出入,但是整體結(jié)論是一樣的:當(dāng)使用新版本時,會有更慢的編譯速度和更大的可執(zhí)行文件。這并不是因為微軟公司編
譯器的問題,使用GCC測試也會得到同樣的結(jié)論。
當(dāng)然,和過去不一樣,可執(zhí)行文件的大小并不是那么重要,現(xiàn)在,可編程設(shè)備種類正快速增長,包括許多信息應(yīng)用,如遙控、手機、智能冰箱、基
于藍(lán)牙技術(shù)的咖啡機等等,在這些應(yīng)用中內(nèi)存近幾年都會是十分寶貴的資源。使用標(biāo)準(zhǔn)iostream
而產(chǎn)生的額外的二進制文件,來源于內(nèi)聯(lián)了整個模板類的代碼,要是沒有code
bload工具,你很難優(yōu)化那些重要的操作。對我來說,編譯時間問題更嚴(yán)重一些,因為這樣意味著更長的等待,從而失去了開發(fā)中非常重要原則:互動原則。
現(xiàn)在我們來考慮調(diào)試的問題。標(biāo)準(zhǔn)庫中string 類的模板實現(xiàn)非常聰明,但并不適合于調(diào)試。你會面臨使用超長名字的編譯器和調(diào)試器的信息:
class std::basic_string<char,struct std::char_traits<char>,class std::allocator<char>>
同
樣對于非常有用的容器 map < string,string > ,
你可以去想象其復(fù)雜性。這些名字太長了,以至于產(chǎn)生數(shù)十個內(nèi)部名字被截斷的警告。對于初學(xué)者來說,std::string
應(yīng)該設(shè)計得盡可能透明,而不應(yīng)該讓他們面臨許多語言內(nèi)置得一些特性。當(dāng)輸出了編譯錯誤信息后,在技術(shù)上講,應(yīng)該是可以查找到所有的 typedef
。我在 UnderC 項目中就試圖這么做。Verity Stob
建議編寫一個后置的處理器來翻譯這些錯誤信息,我倒希望這是她這么做只是開個玩笑。如果不使用這么復(fù)雜的類型,這個問題就會容易處理的多。我在C++開發(fā)
上的秘訣就是(我首次坦誠的公開這個秘密): 在稍微大一點的工程中使用一個兼容的string 類來替換std::string 的頭文件.
有時我會重新build 這些標(biāo)準(zhǔn)的頭文件,用來檢測是否我的庫還能正常使用,但讓其他人為如何提高其性能而努力。
當(dāng)然,在許多應(yīng)用中我們都需要這種std::string提供的靈活性,例如,需要同時處理ASCII
和Unicode字符串,或者需要定制自己的allocator
等等。但這并不是普遍需求(通常程序員要么只處理ASCII,要么只處理Unicode ),
看起來對于程序員承擔(dān)這種范型機制有些不公平。這種機制確實讓標(biāo)準(zhǔn)庫的設(shè)計者覺得很有意思,但增加了應(yīng)用開發(fā)程序員使用的復(fù)雜度。這似乎顛倒了這個原則:
良好的標(biāo)準(zhǔn)庫設(shè)計應(yīng)該隱藏其實現(xiàn)的復(fù)雜度,而讓用戶直接使用。但std::string
對其實現(xiàn)的復(fù)雜度隱藏得并不夠,導(dǎo)致在用戶使用過程中不斷的遇到設(shè)計中的問題。我們不能要求標(biāo)準(zhǔn)庫的用戶都是專家。標(biāo)準(zhǔn)堅持要求這種特定的實現(xiàn)方式,和標(biāo)
準(zhǔn)庫的設(shè)計初衷相違背,其初衷是只提供公共的接口和包含一些特定功能的類庫。自然,這種范型模板對于那些真正去要他們的人是一直有效的。
這些細(xì)節(jié)考慮同樣應(yīng)用于標(biāo)準(zhǔn)容器,例如list<>容器,list
有一些額外的默認(rèn)模板參數(shù),用于定義了默認(rèn)的allocator。當(dāng)然自己定義allocator
十分有用,但絕大多數(shù)人不需要自己去實現(xiàn)。這些泛化的版本完全可以作為單獨的模板提供。我承認(rèn)這樣做會讓標(biāo)準(zhǔn)庫的設(shè)計在技術(shù)上變得沒有以前有意思,但這些
庫在設(shè)計之初就應(yīng)該考慮到最終用戶。篡改一下C++的頌歌:用戶不應(yīng)該為他們不需要的東西買單。
當(dāng)我們不需要模板的時候,我們不得不使用模板。除此之外,在C++中用范型編程還會遇到另一個的問題。大多數(shù)人都同意,標(biāo)準(zhǔn)的algorithm 十分有用。如果你有一個整型的vector, 你可以直接使用下面的語句來排序:
因為int型數(shù)據(jù)的比較函數(shù)時內(nèi)聯(lián)的,而且這種范型算法比舊版本的qsort()函數(shù)速度還快,也更容易使用,特別是使用用戶自定義類型的vector. copy()函數(shù)也可以在任何時候高效率地拷貝任何數(shù)據(jù)。
但有些應(yīng)用理解起來十分晦澀:
copy_if(v.begin(),v.end(),ostream_iterator<int>(cout) bind2nd(greater<int>(),7));
如果要寫得嚴(yán)格一點,每個名字都應(yīng)該加上std::前綴,這里假定所有變量都是使用全局命名空間,或單獨使用命令或用其他方法。用Stroustrup (C++的創(chuàng)始人)的例子更容易說明問題,這個例子把所有的整型數(shù)輸出到終端:
vector<int>::iterator li;
for (li = v.begin(); li != v.end(); ++li)
if (*li > 7) cout << *li;
Stroustrup
告訴我們?nèi)绻褂蔑@示的循環(huán)是"麻煩而又容易產(chǎn)生錯誤",
但我看不出使用第一個版本有什么優(yōu)勢。顯然,人們能習(xí)慣這種方式,人類的適應(yīng)性很強,作為專業(yè)人士,我們也不得不學(xué)習(xí)這個新概念。但是,這樣做并沒有減少
多少麻煩,而且我們可以證明這樣做可讀性更差,更不靈活。同時,它還會限制你的設(shè)計。例如,假設(shè)我們有一個Shape * 的指針list,
我們可以通過下面的調(diào)用方式來畫出他們自己的形狀:
for_each(ls.begin(),ls.end(),
bind2nd(mem_fun(&Shape::draw),canvas));
也可以選擇這種方式:
ShapeList::iterator li;
for (li = ls.begin(); li != ls.end(); ++li)
(*li)->draw(canvas);
現(xiàn)
在假設(shè)我需要修改我的設(shè)計,我只想畫那些滿足某種要求的圖形(而且不希望把這些需求包在shape類里面),
那么我只需要在顯式的循環(huán)中增加一條if條件語句。如果要使用范型概念,我唯一能想到的方式定義一個函數(shù),然后使用for_each()算法。使用設(shè)計模
式一書中的術(shù)語,第一個例子是一個內(nèi)部迭代器(internal iterator),第二個例子式一個外部跌倒器(external
iterator). 作者認(rèn)為C++
并不擅長使用內(nèi)部迭代器,我想我們還是應(yīng)該考慮語言的局限性。其實問題在于在C++中過度應(yīng)用范型概念--從而導(dǎo)致不必要的難度。C++
完全不支持一般的匿名函數(shù)(anonymous functions)如LIST, SmallTalk,
Ruby等。C++中的匿名函數(shù)或許看起來和下面一樣,可能某天有人會實現(xiàn)它:
for_each(ls.begin(),ls.end(),
void lambda(Shape *p) { p->draw(canvas); });
C++
是一種不可思議的編程語言,小到手機,大到跨國際網(wǎng)絡(luò),都有其應(yīng)用。它非常靈活,能夠支持多種編程風(fēng)格,但這種靈活同樣也是其問題所在。編程的藝術(shù)在于為
特定的問題選擇合適編程風(fēng)格,就像老師總提醒寫作文是要選擇好的風(fēng)格一樣。我并不想詆毀 C++
標(biāo)準(zhǔn)庫,這里面包含了許多人的辛勤勞動,并為大家提供了一個公共平臺。我對于這個標(biāo)準(zhǔn)的態(tài)度是,它和范型編程聯(lián)系過于緊密,從而變成了在說明什么風(fēng)格是好
的編程風(fēng)格(例如,算法中明顯傾向于不要使用顯式循環(huán)),
同時它也讓程序員們不得不介入一些實現(xiàn)細(xì)節(jié)(如basic_string<>),這樣做讓人們更加覺得C++
是只是內(nèi)核工程師們的編程語言。