1、什么是STL
不知道你是否有過這樣的經(jīng)歷。在你準(zhǔn)備著手完成數(shù)據(jù)結(jié)構(gòu)老師所布置的家庭作業(yè)時,或者在你為你所負(fù)責(zé)的某個軟件項目中添加一項新功能時,你發(fā)現(xiàn)需要用到一個鏈表(List)或者是映射表(Map)之類的東西,但是手頭并沒有現(xiàn)成的代碼。于是在你開始正式考慮程序功能之前,手工實現(xiàn)List或者M(jìn)ap是不可避免的。于是……,最終你順利完成了任務(wù)。或許此時,作為一個具有較高素養(yǎng)的程序員的你還不肯罷休(或者是一個喜歡偷懶的優(yōu)等生:),因為你會想到,如果以后還遇到這樣的情況怎么辦?沒有必要再做一遍同樣的事情吧!
如果說上述這種情形每天都在發(fā)生,或許有點夸張。但是,如果說整個軟件領(lǐng)域里,數(shù)十年來確實都在為了一個目標(biāo)而奮斗--可復(fù)用性(reusability),這看起來似乎并不夸張。從最早的面向過程的函數(shù)庫,到面向?qū)ο蟮某绦蛟O(shè)計思想,到各種組件技術(shù)(如:COM、EJB),到設(shè)計模式(design pattern)等等。而STL也在做著類似的事情,同時在它背后蘊(yùn)涵著一種新的程序設(shè)計思想--泛型化設(shè)計(generic programming)。
STL(Standard Template Library),即標(biāo)準(zhǔn)模板庫,是一個具有工業(yè)強(qiáng)度的,高效的C++程序庫。它被容納于C++標(biāo)準(zhǔn)程序庫(C++ Standard Library)中,是ANSI/ISO C++標(biāo)準(zhǔn)中最新的也是極具革命性的一部分。該庫包含了諸多在計算機(jī)科學(xué)領(lǐng)域里所常用的基本數(shù)據(jù)結(jié)構(gòu)和基本算法。為廣大C++程序員們提供了一個可擴(kuò)展的應(yīng)用框架,高度體現(xiàn)了軟件的可復(fù)用性。這種現(xiàn)象有些類似于Microsoft Visual C++中的MFC(Microsoft Foundation Class Library),或者是Borland C++ Builder中的VCL(Visual Component Library),對于此二者,大家一定不會陌生吧。
從邏輯層次來看,在STL中體現(xiàn)了泛型化程序設(shè)計的思想(generic programming),引入了諸多新的名詞,比如像需求(requirements),概念(concept),模型(model),容器(container),算法(algorithmn),迭代子(iterator)等。與OOP(object-oriented programming)中的多態(tài)(polymorphism)一樣,泛型也是一種軟件的復(fù)用技術(shù)。
從實現(xiàn)層次看,整個STL是以一種類型參數(shù)化(type parameterized)的方式實現(xiàn)的,這種方式基于一個在早先C++標(biāo)準(zhǔn)中沒有出現(xiàn)的語言特性--模板(template)。如果查閱任何一個版本的STL源代碼,你就會發(fā)現(xiàn),模板作為構(gòu)成整個STL的基石是一件千真萬確的事情。除此之外,還有許多C++的新特性為STL的實現(xiàn)提供了方便。
1.3.1 STL和C++
沒有C++語言就沒有STL,這么說毫不為過。一般而言,STL作為一個泛型化的數(shù)據(jù)結(jié)構(gòu)和算法庫,并不牽涉具體語言(當(dāng)然,在C++里,它被稱為 STL)。也就是說,如果條件允許,用其他語言也可以實現(xiàn)之。這里所說的條件,主要是指類似于"模板"這樣的語法機(jī)制。如果你沒有略過前一節(jié)內(nèi)容的話,應(yīng)該可以看到,Alexander Stepanov在選擇C++語言作為實現(xiàn)工具之前,早以采用過多種程序設(shè)計語言。但是,為什么最終還是C++幸運(yùn)的承擔(dān)了這個歷史性任務(wù)呢?原因不僅在于前述那個條件,還在于C++在某些方面所表現(xiàn)出來的優(yōu)越特性,比如:高效而靈活的指針。但是如果把C++作為一種OOP(Object- Oriented Programming,面向?qū)ο蟪绦蛟O(shè)計)語言來看待的話(事實上我們一般都是這么認(rèn)為的,不是嗎?),其功能強(qiáng)大的繼承機(jī)制卻沒有給STL的實現(xiàn)幫上多大的忙。在STL的源代碼里,并沒有太多太復(fù)雜的繼承關(guān)系。繼承的思想,甚而面向?qū)ο蟮乃枷耄€不足以實現(xiàn)類似STL這樣的泛型庫。C++只有在引入了 "模板"之后,才直接導(dǎo)致了STL的誕生。這也正是為什么,用其他比C++更純的面向?qū)ο笳Z言無法實現(xiàn)泛型思想的一個重要原因。當(dāng)然,事情總是在變化之中,像Java在這方面,就是一個很好的例子,jdk1.4中已經(jīng)加入了泛型的特性。
此外,STL對于C++的發(fā)展,尤其是模板機(jī)制,也起到了促進(jìn)作用。比如:模板函數(shù)的偏特化(template function partial specialization),它被用于在特定應(yīng)用場合,為一般模板函數(shù)提供一系列特殊化版本。這一特性是繼STL被ANSI/ISO C++標(biāo)準(zhǔn)委員會通過之后,在Bjarne和Stepanov共同商討之下并由Bjarne向委員會提出建議的,最終該項建議被通過。這使得STL中的一些算法在處理特殊情形時可以選擇非一般化的方式,從而保證了執(zhí)行的效率。
1.3.2 STL和C++標(biāo)準(zhǔn)函數(shù)庫
STL是最新的C++標(biāo)準(zhǔn)函數(shù)庫中的一個子集,這個龐大的子集占據(jù)了整個庫的大約80%的分量。而作為在實現(xiàn)STL過程中扮演關(guān)鍵角色的模板則充斥了幾乎整個C++標(biāo)準(zhǔn)函數(shù)庫。在這里,我們有必要看一看C++標(biāo)準(zhǔn)函數(shù)庫里包含了哪些內(nèi)容,其中又有哪些是屬于標(biāo)準(zhǔn)模板庫(即STL)的。
C++標(biāo)準(zhǔn)函數(shù)庫為C++程序員們提供了一個可擴(kuò)展的基礎(chǔ)性框架。我們從中可以獲得極大的便利,同時也可以通過繼承現(xiàn)有類,自己編制符合接口規(guī)范的容器、算法、迭代子等方式對之進(jìn)行擴(kuò)展。它大致包含了如下幾個組件:
C標(biāo)準(zhǔn)函數(shù)庫,基本保持了與原有C語言程序庫的良好兼容,盡管有些微變化。人們總會忍不住留戀過去的美好歲月,如果你曾經(jīng)是一個C程序員,對這一點一定體會頗深。或許有一點會讓你覺得奇怪,那就是在C++標(biāo)準(zhǔn)庫中存在兩套C的函數(shù)庫,一套是帶有.h擴(kuò)展名的(比如<stdio.h>),而另一套則沒有(比如<cstdio>)。它們確實沒有太大的不同。
語言支持(language support)部分,包含了一些標(biāo)準(zhǔn)類型的定義以及其他特性的定義,這些內(nèi)容,被用于標(biāo)準(zhǔn)庫的其他地方或是具體的應(yīng)用程序中。
診斷(diagnostics)部分,提供了用于程序診斷和報錯的功能,包含了異常處理(exception handling),斷言(assertions),錯誤代碼(error number codes)三種方式。
通用工具(general utilities)部分,這部分內(nèi)容為C++標(biāo)準(zhǔn)庫的其他部分提供支持,當(dāng)然你也可以在自己的程序中調(diào)用相應(yīng)功能。比如:動態(tài)內(nèi)存管理工具,日期/時間處理工具。記住,這里的內(nèi)容也已經(jīng)被泛化了(即采用了模板機(jī)制)。
字符串(string)部分,用來代表和處理文本。它提供了足夠豐富的功能。事實上,文本是一個string對象,它可以被看作是一個字符序列,字符類型可能是char,或者wchar_t等等。string可以被轉(zhuǎn)換成char*類型,這樣便可以和以前所寫的C/C++代碼和平共處了。因為那時侯除了 char*,沒有別的。
國際化(internationalization)部分,作為OOP特性之一的封裝機(jī)制在這里扮演著消除文化和地域差異的角色,采用locale和facet可以為程序提供眾多國際化支持,包括對各種字符集的支持,日期和時間的表示,數(shù)值和貨幣的處理等等。畢竟,在中國和在美國,人們表示日期的習(xí)慣是不同的。
容器(containers)部分,STL的一個重要組成部分,涵蓋了許多數(shù)據(jù)結(jié)構(gòu),比如前面曾經(jīng)提到的鏈表,還有:vector(類似于大小可動態(tài)增加的數(shù)組)、queue(隊列)、stack(堆棧)……。string 也可以看作是一個容器,適用于容器的方法同樣也適用于string。現(xiàn)在你可以輕松的完成數(shù)據(jù)結(jié)構(gòu)課程的家庭作業(yè)了。
算法(algorithms)部分,STL的一個重要組成部分,包含了大約70個通用算法,用于操控各種容器,同時也可以操控內(nèi)建數(shù)組。比如:find用于在容器中查找等于某個特定值的元素,for_each用于將某個函數(shù)應(yīng)用到容器中的各個元素上,sort用于對容器中的元素排序。所有這些操作都是在保證執(zhí)行效率的前提下進(jìn)行的,所以,如果在你使用了這些算法之后程序變得效率底下,首先一定不要懷疑這些算法本身,仔細(xì)檢查一下程序的其他地方。
迭代器(iterators)部分,STL的一個重要組成部分,如果沒有迭代器的撮合,容器和算法便無法結(jié)合的如此完美。事實上,每個容器都有自己的迭代器,只有容器自己才知道如何訪問自己的元素。它有點像指針,算法通過迭代器來定位和操控容器中的元素。
數(shù)值(numerics)部分,包含了一些數(shù)學(xué)運(yùn)算功能,提供了復(fù)數(shù)運(yùn)算的支持。
輸入/輸出(input/output)部分,就是經(jīng)過模板化了的原有標(biāo)準(zhǔn)庫中的iostream部分,它提供了對C++程序輸入輸出的基本支持。在功能上保持了與原有iostream的兼容,并且增加了異常處理的機(jī)制,并支持國際化(internationalization)。
總體上,在C++標(biāo)準(zhǔn)函數(shù)庫中,STL主要包含了容器、算法、迭代器。string也可以算做是STL的一部分。
圖1:STL和C++標(biāo)準(zhǔn)函數(shù)庫
1.3.3 STL和GP,GP和OOP
正如前面所提到的,在STL的背后蘊(yùn)含著泛型化程序設(shè)計(GP)的思想,在這種思想里,大部分基本算法被抽象,被泛化,獨立于與之對應(yīng)的數(shù)據(jù)結(jié)構(gòu),用于以相同或相近的方式處理各種不同情形。這一思想和面向?qū)ο蟮某绦蛟O(shè)計思想(OOP)不盡相同,因為,在OOP中更注重的是對數(shù)據(jù)的抽象,即所謂抽象數(shù)據(jù)類型(Abstract Data Type),而算法則通常被附屬于數(shù)據(jù)類型之中。幾乎所有的事情都可以被看作類或者對象(即類的實例),通常,我們所看到的算法被作為成員函數(shù)(member function)包含在類(class)中,類和類則構(gòu)成了錯綜復(fù)雜的繼承體系。
盡管在象C++這樣的程序設(shè)計語言中,你還可以用全局函數(shù)來表示算法,但是在類似于Java這樣的純面向?qū)ο蟮恼Z言中,全局函數(shù)已經(jīng)被"勒令禁止"了。因此,用Java來模擬GP思想是頗為困難的。如果你對前述的STL歷史還有印象的話,應(yīng)該記得Alexander Stepanove也曾用基于OOP的語言嘗試過實現(xiàn)GP思想,但是效果并不好,包括沒有引入模板之前的C++語言。站在巨人的肩膀上,我們可以得出這樣的結(jié)論,在OOP中所體現(xiàn)的思想與GP的思想確實是相異的。C++并不是一種純面向?qū)ο蟮某绦蛟O(shè)計語言,它的絕妙之處,就在于既滿足了OOP,又成全了 GP。對于后者,模板立下了汗馬功勞。另外,需要指出的是,盡管GP和OOP有諸多不同,但這種不同還不至于到"水火不容"的地步。并且,在實際運(yùn)用的時候,兩者的結(jié)合使用往往可以使問題的解決更為有效。作為GP思想實例的STL本身便是一個很好的范例,如果沒有繼承,不知道STL會是什么樣子,似乎沒有人做過這樣的試驗。
1.4 STL的不同實現(xiàn)版本
1.4.1 HP STL 1.4.2 P.J. Plauger STL 1.4.3 Rouge Wave STL
1.4.4 STLport
STLport最初源于俄國人Boris Fomitchev的一個開發(fā)項目,主要用于將SGI STL的基本代碼移植到其他諸如C++Builder或者是Visual C++這樣的主流編譯器上。因為SGI STL屬于開放源碼,所以STLport才有權(quán)這樣做。目前STLport的最新版本是4.5。可以從如下網(wǎng)站得到更詳細(xì)的情況介紹://www.stlport.org,可以免費(fèi)下載其源代碼。STLport已經(jīng)被C/C++技術(shù)委員會接受成為工業(yè)標(biāo)準(zhǔn),且在許多平臺上都支持。根據(jù)測試STLport的效率比VC中的STL要快。比Rouge Wave STL更符合標(biāo)準(zhǔn),也更容易移植。Borland C++ Builder已經(jīng)在其6.0版中加入了對STLport的支持,它使用的STLport就是4.5版的,C++ Builder 6.0同時還提供了STLport的使用說明。你可以在C++ Builder的Include\Stlport子目錄下找到所有頭文件(比如:C:\Program Files\Borland\Cbuilder6\Include\Stlport)。
1.4.5 SGI STL
SGI STL是由Silicon Graphics Computer System, Inc公司實現(xiàn)的,其設(shè)計者和編寫者包括Alexander Stepanov和Matt Austern,同樣它也是HP STL的一個繼承版本。它屬于開放源碼,因此你可以修改和銷售它。SGI STL被GCC(linux下的C++編譯器)所采用,你可以在GCC的Include子目錄下找到所有頭文件(比如:C:\cygnus\cygwin -b20\include\g++\include)。由于GCC對C++語言標(biāo)準(zhǔn)的支持很好,SGI STL在linux平臺上的性能相當(dāng)出色。此外,其源代碼的可讀性也很好。可以從如下網(wǎng)站得到更詳細(xì)的情況介紹:http://www.sgi.com,可以免費(fèi)下載其源代碼。目前的最新版本是3.3。
非常遺憾,我不得不舍棄"Hello World"這個經(jīng)典的范例,盡管它不只一次的被各種介紹計算機(jī)語言的教科書所引用,幾乎成為了一個默認(rèn)的“標(biāo)準(zhǔn)”。其原因在于它太過簡單了,以至于不具備代表性,無法展現(xiàn)STL的巨大魅力。我選用了一個稍稍復(fù)雜一點的例子,它的大致功能是:從標(biāo)準(zhǔn)輸入設(shè)備(一般是鍵盤)讀入一些整型數(shù)據(jù),然后對它們進(jìn)行排序,最終將結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備(一般是顯示器屏幕)。這是一種典型的處理方式,程序本身具備了一個系統(tǒng)所應(yīng)該具有的幾乎所有的基本特征:輸入 + 處理 + 輸出。你將會看到三個不同版本的程序。第一個是沒有使用STL的普通C++程序,你將會看到完成這樣看似簡單的事情,需要花多大的力氣,而且還未必沒有一點問題(真是吃力不討好)。第二個程序的主體部分使用了STL特性,此時在第一個程序中所遇到的問題就基本可以解決了。同時,你會發(fā)現(xiàn)采用了STL之后,程序變得簡潔明快,清晰易讀。第三個程序則將STL的功能發(fā)揮到了及至,你可以看到程序里幾乎每一行代碼都是和STL相關(guān)的。這樣的機(jī)會并不總是隨處可見的,它展現(xiàn)了STL中的幾乎所有的基本組成部分,盡管這看起來似乎有點過分了。
有幾點是需要說明的:
這個例程的目的,在于向你演示如何在C++程序中使用STL,同時希望通過實踐,證明STL所帶給你的確確實實的好處。程序中用到的一些STL基本組件,比如:vector(一種容器)、sort(一種排序算法),你只需要有一個大致的概念就可以了,這并不影響閱讀代碼和理解程序的含義。
2.2.1 第一版:史前時代--轉(zhuǎn)木取火
在STL還沒有降生的"黑暗時代",C++程序員要完成前面所提到的那些功能,需要做很多事情(不過這比起C程序來,似乎好一點),程序大致是如下這個樣子的:
// name:example2_1.cpp
// alias:Rubish
#include <stdlib.h>
#include <iostream.h>
int compare(const void *arg1, const void *arg2);
void main(void)
{
const int max_size = 10; // 數(shù)組允許元素的最大個數(shù)
int num[max_size]; // 整型數(shù)組
// 從標(biāo)準(zhǔn)輸入設(shè)備讀入整數(shù),同時累計輸入個數(shù),
// 直到輸入的是非整型數(shù)據(jù)為止
int n;
for (n = 0; cin >> num[n]; n ++);
// C標(biāo)準(zhǔn)庫中的快速排序(quick-sort)函數(shù)
qsort(num, n, sizeof(int), compare);
// 將排序結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備
for (int i = 0; i < n; i ++)
cout << num[i] << "\n";
}
// 比較兩個數(shù)的大小,
// 如果*(int *)arg1比*(int *)arg2小,則返回-1
// 如果*(int *)arg1比*(int *)arg2大,則返回1
// 如果*(int *)arg1等于*(int *)arg2,則返回0
int compare(const void *arg1, const void *arg2)
{
return (*(int *)arg1 < *(int *)arg2) ? -1 :
(*(int *)arg1 > *(int *)arg2) ? 1 : 0;
}
這是一個和STL沒有絲毫關(guān)系的傳統(tǒng)風(fēng)格的C++程序。因為程序的注釋已經(jīng)很詳盡了,所以不需要我再做更多的解釋。總的說來,這個程序看起來并不十分復(fù)雜(本來就沒有太多功能)。只是,那個compare函數(shù),看起來有點費(fèi)勁。指向它的函數(shù)指針被作為最后一個實參傳入qsort函數(shù),qsort是C程序庫stdlib.h中的一個函數(shù)。以下是qsort的函數(shù)原型:
void qsort(void *base, size_t num, size_t width, int (__cdecl *compare )(const void *elem1, const void *elem2 ) ); 看起來有點令人作嘔,尤其是最后一個參數(shù)。大概的意思是,第一個參數(shù)指明了要排序的數(shù)組(比如:程序中的num),第二個參數(shù)給出了數(shù)組的大小(qsort沒有足夠的智力預(yù)知你傳給它的數(shù)組的實際大小),第三個參數(shù)給出了數(shù)組中每個元素以字節(jié)為單位的大小。最后那個長長的家伙,給出了排序時比較元素的方式(還是因為qsort的智商問題)。
以下是某次運(yùn)行的結(jié)果:
輸入:0 9 2 1 5
輸出:0 1 2 5 9有一個問題,這個程序并不像看起來那么健壯(Robust)。如果我們輸入的數(shù)字個數(shù)超過max_size所規(guī)定的上限,就會出現(xiàn)數(shù)組越界問題。如果你在Visual C++的IDE環(huán)境下以控制臺方式運(yùn)行這個程序時,會彈出非法內(nèi)存訪問的錯誤對話框。這個問題很嚴(yán)重,嚴(yán)重到足以使你開始重新審視這個程序的代碼。為了彌補(bǔ)程序中的這一缺陷。我們不得不考慮采用如下三種方案中的一種:
- 采用大容量的靜態(tài)數(shù)組分配。
- 限定輸入的數(shù)據(jù)個數(shù)。
- 采用動態(tài)內(nèi)存分配。
第一種方案比較簡單,你所做的只是將max_size改大一點,比如:1000或者10000。但是,嚴(yán)格講這并不能最終解決問題,隱患仍然存在。假如有人足夠耐心,還是可以使你的這個經(jīng)過糾正后的程序崩潰的。此外,分配一個大數(shù)組,通常是在浪費(fèi)空間,因為大多數(shù)情況下,數(shù)組中的一部分空間并沒有被利用。
再來看看第二種方案,通過在第一個for循環(huán)中加入一個限定條件,可以使問題得到解決。比如:for (int n = 0; cin >> num[n] && n < max_size; n ++); 但是這個方案同樣不甚理想,盡管不會使程序崩潰,但失去了靈活性,你無法輸入更多的數(shù)。
看來只有選擇第三種方案了。是的,你可以利用指針,以及動態(tài)內(nèi)存分配妥善的解決上述問題,并且使程序具有良好的靈活性。這需要用到new,delete操作符,或者古老的malloc(), realloc()和free()函數(shù)。但是為此,你將犧牲程序的簡潔性,使程序代碼陡增,代碼的處理邏輯也不再像原先看起來那么清晰了。一個 compare函數(shù)或許就已經(jīng)令你不耐煩了,更何況要實現(xiàn)這些復(fù)雜的處理機(jī)制呢?很難保證你不會在處理這個問題的時候出錯,很多程序的bug往往就是這樣產(chǎn)生的。同時,你還應(yīng)該感謝stdlib.h,它為你提供了qsort函數(shù),否則,你還需要自己實現(xiàn)排序算法。如果你用的是冒泡法排序,那效率就不會很理想。……,問題真是越來越讓人頭疼了!
關(guān)于第一個程序的討論就到此為止,如果你對第三種方案感興趣的話,可以嘗試著自己編寫一個程序,作為思考題。這里就不準(zhǔn)備再浪費(fèi)筆墨去實現(xiàn)這樣一個讓人不甚愉快的程序了。
2.2.2 第二版:工業(yè)時代--組件化大生產(chǎn)
我們應(yīng)該慶幸自己所生活的年代。工業(yè)時代,科技的發(fā)展所帶來的巨大便利已經(jīng)影響到了我們生活中的每個細(xì)節(jié)。如果你還在以原始人類的方式生活著,那我真該懷疑你是否屬于某個生活在非洲或者南美叢林里的原始部落中的一員了,難道是瑪雅文明又重現(xiàn)了?
STL便是這個時代的產(chǎn)物,正如其他科技成果一樣,C++程序員也應(yīng)該努力使自己適應(yīng)并充分利用這個"高科技成果"。讓我們重新審視第一版的那個破爛不堪的程序。試著使用一下STL,看看效果如何。
#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
void main(void)
{
vector<int> num; // STL中的vector容器
int element;
// 從標(biāo)準(zhǔn)輸入設(shè)備讀入整數(shù),
// 直到輸入的是非整型數(shù)據(jù)為止
while (cin >> element)
num.push_back(element);
// STL中的排序算法
sort(num.begin(), num.end());
// 將排序結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備
for (int i = 0; i < num.size(); i ++)
cout << num[i] << "\n";
}
這個程序的主要部分改用了STL的部件,看起來要比第一個程序簡潔一點,你已經(jīng)找不到那個討厭的compare函數(shù)了。它真的能很好的運(yùn)行嗎?你可以試試,因為程序的運(yùn)行結(jié)果和前面的大致差不多,所以在此略去。我可以向你保證,這個程序是足夠健壯的。不過,可能你還沒有完全看明白程序的代碼,所以我需要為你解釋一下。畢竟,這個戲法變得太快了,較之第一個程序,一眨眼的功夫,那些老的C++程序員所熟悉的代碼都不見了,取而代之的是一些新鮮玩意兒。
程序的前三行是包含的頭文件,它們提供了程序所要用到的所有C++特性(包括輸入輸出處理,STL中的容器和算法)。不必在意那個.h,并不是我的疏忽,程序保證可以編譯通過,只要你的C++編譯器支持標(biāo)準(zhǔn)C++規(guī)范的相關(guān)部分。你只需要把它們看作是一些普通的C++頭文件就可以了。事實上,也正是如此,如果你對這個變化細(xì)節(jié)感興趣的化,可以留意一下你身旁的佐餐。
同樣可以忽略第四行的存在。加入那個聲明只是為了表明程序引用到了std這個標(biāo)準(zhǔn)名字空間(namespace),因為STL中的那些玩意兒全都包含在那里面。只有通過這行聲明,編譯器才能允許你使用那些有趣的特性。
程序中用到了vector,它是STL中的一個標(biāo)準(zhǔn)容器,可以用來存放一些元素。你可以把vector理解為int [?],一個整型的數(shù)組。之所以大小未知是因為,vector是一個可以動態(tài)調(diào)整大小的容器,當(dāng)容器已滿時,如果再放入元素則vector會悄悄擴(kuò)大自己的容量。push_back是vector容器的一個類屬成員函數(shù),用來在容器尾端插入一個元素。main函數(shù)中第一個while循環(huán)做的事情就是不斷向 vector容器尾端插入整型數(shù)據(jù),同時自動維護(hù)容器空間的大小。
sort是STL中的標(biāo)準(zhǔn)算法,用來對容器中的元素進(jìn)行排序。它需要兩個參數(shù)用來決定容器中哪個范圍內(nèi)的元素可以用來排序。這里用到了vector的另兩個類屬成員函數(shù)。begin()用以指向vector的首端,而end()則指向vector的末端。這里有兩個問題,begin()和end()的返回值是什么?這涉及到STL的另一個重要部件--迭代器(Iterator),不過這里并不需要對它做詳細(xì)了解。你只需要把它當(dāng)作是一個指針就可以了,一個指向整型數(shù)據(jù)的指針。相應(yīng)的sort函數(shù)聲明也可以看作是void sort(int* first, int* last),盡管這實際上很不精確。另一個問題是和end()函數(shù)有關(guān),盡管前面說它的返回值指向vector的末端,但這種說法不能算正確。事實上,它的返回值所指向的是vector中最末端元素的后面一個位置,即所謂pass-the-end value。這聽起來有點費(fèi)解,不過不必在意,這里只是稍帶一提。總的來說,sort函數(shù)所做的事情是對那個準(zhǔn)整型數(shù)組中的元素進(jìn)行排序,一如第一個程序中的那個qsort,不過比起qsort來,sort似乎要簡單了許多。
程序的最后是輸出部分,在這里vector完全可以以假亂真了,它所提供的對元素的訪問方式簡直和普通的C++內(nèi)建數(shù)組一模一樣。那個size函數(shù)用來返回vector中的元素個數(shù),就相當(dāng)于第一個程序中的變量n。這兩行代碼直觀的不用我再多解釋了。
我想我的耐心講解應(yīng)該可以使你大致看懂上面的程序了,事實上STL的運(yùn)用使程序的邏輯更加清晰,使代碼更易于閱讀。試問,有誰會不明白begin、 end、size這樣的字眼所表達(dá)的含義呢(除非他不懂英語)?試著運(yùn)行一下,看看效果。再試著多輸入幾個數(shù),看看是否會發(fā)生數(shù)組越界現(xiàn)象。實踐證明,程序運(yùn)行良好。是的,由于vector容器自行維護(hù)了自身的大小,C++程序員就不用操心動態(tài)內(nèi)存分配了,指針的錯誤使用畢竟會帶來很多麻煩,同時程序也會變得冗長無比。這正是前面第三種方案的缺點所在
2.2.3 第三版:唯美主義的杰作
事態(tài)的發(fā)展有時候總會趨向極端,這在那些唯美主義者當(dāng)中猶是如此。首先聲明,我并不是一個唯美主義者,提供第二版程序的改進(jìn)版,完全是為了讓你更深刻的感受到STL的魅力所在。在看完第三版之后,你會強(qiáng)烈感受到這一點。或許你也會變成一個唯美主義者了,至少在STL方面。這應(yīng)該不是我的錯,因為決定權(quán)在你手里。下面我們來看看這個絕版的C++程序。
// name:example2_3.cpp
// alias:aesthetic version
#include <iostream>
#include <vector>
#include <algorithm>
#include <iterator>
using namespace std;
void main(void)
{
typedef vector<int> int_vector;
typedef istream_iterator<int> istream_itr;
typedef ostream_iterator<int> ostream_itr;
typedef back_insert_iterator< int_vector > back_ins_itr;
// STL中的vector容器
int_vector num;
// 從標(biāo)準(zhǔn)輸入設(shè)備讀入整數(shù),
// 直到輸入的是非整型數(shù)據(jù)為止
copy(istream_itr(cin), istream_itr(), back_ins_itr(num));
// STL中的排序算法
sort(num.begin(), num.end());
// 將排序結(jié)果輸出到標(biāo)準(zhǔn)輸出設(shè)備
copy(num.begin(), num.end(), ostream_itr(cout, "\n"));
}
在這個程序里幾乎每行代碼都是和STL有關(guān)的(除了main和那對花括號,當(dāng)然還有注釋),并且它包含了STL中幾乎所有的各大部件(容器 container,迭代器iterator, 算法algorithm, 適配器adaptor),唯一的遺憾是少了函數(shù)對象(functor)的身影。
還記得開頭提到的一個典型系統(tǒng)所具有的基本特征嗎?--輸入+處理+輸出。所有這些功能,在上面的程序里,僅僅是通過三行語句來實現(xiàn)的,其中每一行語句對應(yīng)一種操作。對于數(shù)據(jù)的操作被高度的抽象化了,而算法和容器之間的組合,就像搭積木一樣輕松自如,系統(tǒng)的耦合度被降到了極低點。這就是閃耀著泛型之光的STL的偉大力量。如此簡潔,如此巧妙,如此神奇!就像魔術(shù)一般,以至于再一次讓你摸不著頭腦。怎么實現(xiàn)的?為什么在看第二版程序的時候如此清晰的你,又墜入了五里霧中(竊喜)。
請留意此處的標(biāo)題(唯美主義的杰作),在實際環(huán)境中,你未必要做到這樣完美。畢竟美好愿望的破滅,在生活中時常會發(fā)生。過于理想化,并不是一件好事,至少我是這么認(rèn)為的。正如前面提到的,這個程序只是為了展示STL的獨特魅力,你不得不為它的出色表現(xiàn)所折服,也許只有深諳STL之道的人才會想出這樣的玩意兒來。如果你只是一般性的使用STL,做到第二版這樣的程度也就可以了。
實在是因為這個程序太過"簡單",以至于我無法肯定,在你還沒有完全掌握STL之前,通過我的講解,是否能夠領(lǐng)會這區(qū)區(qū)三行代碼,我將盡我的最大努力。
前面提到的迭代器可以對容器內(nèi)的任意元素進(jìn)行定位和訪問。在STL里,這種特性被加以推廣了。一個cin代表了來自輸入設(shè)備的一段數(shù)據(jù)流,從概念上講它對數(shù)據(jù)流的訪問功能類似于一般意義上的迭代器,但是C++中的cin在很多地方操作起來并不像是一個迭代器,原因就在于其接口和迭代器的接口不一致(比如:不能對cin進(jìn)行++運(yùn)算,也不能對之進(jìn)行取值運(yùn)算--即*運(yùn)算)。為了解決這個矛盾,就需要引入適配器的概念。istream_iterator便是一個適配器,它將cin進(jìn)行包裝,使之看起來像是一個普通的迭代器,這樣我們就可以將之作為實參傳給一些算法了(比如這里的copy算法)。因為算法只認(rèn)得迭代器,而不會接受cin。對于上面程序中的第一個copy函數(shù)而言,其第一個參數(shù)展開后的形式是:istream_iterator(cin),其第二個參數(shù)展開后的形式是:istream_iterator()(如果你對typedef的語法不清楚,可以參考有關(guān)的c++語言書籍)。其效果是產(chǎn)生兩個迭代器的臨時對象,前一個指向整型輸入數(shù)據(jù)流的開始,后一個則指向"pass-the-end value"。這個函數(shù)的作用就是將整型輸入數(shù)據(jù)流從頭至尾逐一"拷貝"到vector這個準(zhǔn)整型數(shù)組里,第一個迭代器從開始位置每次累進(jìn),最后到達(dá)第二個迭代器所指向的位置。或許你要問,如果那個copy函數(shù)的行為真如我所說的那樣,為什么不寫成如下這個樣子呢?
copy(istream_iterator<int>(cin), istream_iterator<int>(), num.begin());
你確實可以這么做,但是有一個小小的麻煩。還記得第一版程序里的那個數(shù)組越界問題嗎?如果你這么寫的話,就會遇到類似的麻煩。原因在于copy函數(shù)在" 拷貝"數(shù)據(jù)的時候,如果輸入的數(shù)據(jù)個數(shù)超過了vector容器的范圍時,數(shù)據(jù)將會拷貝到容器的外面。此時,容器不會自動增長容量,因為這只是簡單地拷貝,并不是從末端插入。為了解決這個問題,另一個適配器back_insert_iterator登場了,它的作用就是引導(dǎo)copy算法每次在容器末端插入一個數(shù)據(jù)。程序中的那個back_ins_itr(num)展開后就是:back_insert_iterator(num),其效果是生成一個這樣的迭待器對象。終于將講完了三分之一(真不容易!),好在第二句和前一版程序沒有差別,這里就略過了。至于第三句,ostream_itr(cout, "\n")展開后的形式是:ostream_iterator(cout, "\n"),其效果是產(chǎn)生一個處理輸出數(shù)據(jù)流的迭待器對象,其位置指向數(shù)據(jù)流的起始處,并且以"\n"作為分割符。第二個copy函數(shù)將會從頭至尾將 vector中的內(nèi)容"拷貝"到輸出設(shè)備,第一個參數(shù)所代表的迭代器將會從開始位置每次累進(jìn),最后到達(dá)第二個參數(shù)所代表的迭代器所指向的位置。
這就是全部的內(nèi)容。
2.3 歷史的評價
歷史的車輪總是滾滾向前的,工業(yè)時代的文明較之史前時代,當(dāng)然是先進(jìn)并且發(fā)達(dá)的。回顧那兩個時代的C++程序,你會真切的感受到這種差別。簡潔易用,具有工業(yè)強(qiáng)度,較好的可移植性,高效率,加之第三個令人目眩的絕版程序所體現(xiàn)出來的高度抽象性,高度靈活性和組件化特性,使你對STL背后所蘊(yùn)含的泛型化思想都有了些微的感受。
真幸運(yùn),你可以橫跨兩個時代,有機(jī)會目睹這種"文明"的差異。同時,這也應(yīng)該使你越加堅定信念,使自己順應(yīng)時代的潮流。
2.4 如何運(yùn)行
在你還沒有真正開始運(yùn)行前面后兩個程序之前,最好先瀏覽一下本節(jié)。這里簡單介紹了在特定編譯器環(huán)境下運(yùn)行STL程序的一些細(xì)節(jié),并提供了一些可能遇到的問題的解決辦法。
此處,我選用了目前在Windows平臺下較為常見的Microsoft Visual C++ 6.0和Borland C++ Builder 6.0作為例子。盡管Visual C++ 6.0對最新的ANSI/ISO C++標(biāo)準(zhǔn)支持的并不是很好。不過據(jù)稱Visual C++ .NET(也就是VC7.0)在這方面的性能有所改善。
你可以選用多種方式運(yùn)行前面的程序,比如在Visual C++下,你可以直接在DOS命令行狀態(tài)下編譯運(yùn)行,也可以在VC的IDE下采用控制臺應(yīng)用程序(Console Application)的方式運(yùn)行。對于C++ Builder,情況也類似。
對于Visual C++而言,如果是在DOS命令行狀態(tài)下,你首先需要找到它的編譯器。假定你的Visual C++裝在C:\Program Files\Microsoft Visual Studio\VC98下面,則其編譯器所在路徑應(yīng)該是C:\Program Files\Microsoft Visual Studio\VC98\Bin,在那里你可以找到cl.exe文件。編譯時請加上/GX和/MT參數(shù)。如果一切正常,結(jié)果就會產(chǎn)生一個可執(zhí)行文件。如下所示:
cl /GX /MT example2_2.cpp
前一個參數(shù)用于告知編譯器允許異常處理(Exception Handling)。在P. J. Plauger STL中的很多地方使用了異常處理機(jī)制(即try…throw…catch語法),所以應(yīng)該加上這個參數(shù),否則會有如下警告信息:
warning C4530: C++ exception handler used, but unwind semantics are not enabled.
后一個參數(shù)則用于使程序支持多線程,它需要在鏈接時使用LIBCMT.LIB庫文件。不過P. J. Plauger STL并不是線程安全的(thread safety)。如果你是在VC環(huán)境下使用像STLport這樣的STL實現(xiàn)版本,則需要加上這個參數(shù),因為STLport是線程安全的。
如果在IDE環(huán)境下,可以在新建工程的時候選擇控制臺應(yīng)用程序。
圖3:在Visual C++ IDE環(huán)境下運(yùn)行STL程序
至于那些參數(shù)的設(shè)置,則可以通過在Project功能菜單項中的Settings功能【Alt+F7】中設(shè)置編譯選項來完成。
;
圖4:在Visual C++ IDE環(huán)境下設(shè)置編譯參數(shù)
有時,在IDE環(huán)境下編譯STL程序時,可能會出現(xiàn)如下警告信息(前面那幾個示例程序不會出現(xiàn)這種情況):
warning C4786: '……' : identifier was truncated to '255' characters in the debug information
這是因為編譯器在Debug狀態(tài)下編譯時,把程序中所出現(xiàn)的標(biāo)識符長度限制在了255個字符范圍內(nèi)。如果超過最大長度,這些標(biāo)識符就無法在調(diào)試階段查看和計算了。而在STL程序中大量的用到了模板函數(shù)和模板類,編譯器在實例化這些內(nèi)容時,展開之后所產(chǎn)生的標(biāo)識符往往很長(沒準(zhǔn)會有一千多個字符!)。如果你想認(rèn)識一下這個warning的話,很簡單,在程序里加上如下一行代碼:
vector<string> string_array; // 類似于字符串?dāng)?shù)組變量
對于這樣的warning,當(dāng)然可以置之不理,不過也是有解決辦法的。 你可以在文件開頭加入下面這一行:#pragma warning(disable: 4786)。它強(qiáng)制編譯器忽略這個警告信息,這種做法雖然有點粗魯,但是很有效。
至于C++ Builder,其DOS命令行狀態(tài)下的運(yùn)行方式是這樣的。假如你的C++ Builder裝在C:\Program Files\Borland\CBuilder6。則其編譯器所在路徑應(yīng)該是C:\Program Files\ Borland\CBuilder6\Bin,在那里你可以找到bcc32.exe文件,輸入如下命令,即大功告成了:
bcc32 example2_2.cpp
至于IDE環(huán)境下,則可以在新建應(yīng)用程序的時候,選擇控制臺向?qū)В–onsole Wizard)。
圖5:在C++ Builder IDE環(huán)境下運(yùn)行STL程序
現(xiàn)在你可以在你的機(jī)器上運(yùn)行前面的示例程序了。不過,請恕我多嘴,有些細(xì)節(jié)不得不提請你注意。小心編譯器給你留下的陷阱。比如前面第三個程序中有如下這一行代碼:
typedef back_insert_iterator< int_vector > back_ins_itr;
請留意">"前面的空格,最好不要省去。如果你吝惜這點空格所占用的磁盤空間的話,那就太不劃算了。其原因還是在于C++編譯器本身的缺陷。上述代碼,相當(dāng)于如下代碼(編譯器做的也正是這樣的翻譯工作):
typedef back_insert_iterator< vector<int> > back_ins_itr;
如果你沒有加空格的話,編譯器會把">>"誤認(rèn)為是單一標(biāo)識(看起來很像那個數(shù)據(jù)流輸入操作符">>")。為了回避這個難題, C++要求使用者必須在兩個右尖括號之間插入空格。所以,你最好還是老老實實照我的話做,以避免不必要的麻煩。不過有趣的是,對于上述那行展開前的代碼,在Visual C++里即使你沒有加空格,編譯器也不會報錯。而同樣的代碼在C++ Builder中沒有那么幸運(yùn)了。不過,最好還是不要心存僥幸,如果你采用展開后的書寫方式,則兩個編譯器都不會給你留情面了。
引用地址:http://blog.programfan.com/trackback.asp?id=31227