EffectiveSTL:Item16:如何將vector和string的數據傳給傳統的API函數
Item 16:如何將vector和string的數據傳給傳統的API函數
因為 C++語言已經于1998年被標準化,C++的中堅分子在試圖推動程序員從數組轉到vector時就沒什么顧慮了。同樣的情況也發生于從char *指針轉到string對象的過程中。有很好的理由來做這些轉變,比如可以消除常見的編程錯誤(Item 13),和有機會獲得STL泛型算法的全部強大能力 (參見,比如,Item 31)。
但是,麻煩還是有的,而最常見的一個就是已經存在的傳統C風格API函數接受的是數組和char *指針,而不是vector和string對象。這樣的API函數還將會存在很長時間,如果我們要高效使用STL的話,就必須和它們和平共處。
幸運的是,這很容易。如果你有一個vector對象v,而你需要得到一個指向v中數據的指針,以使得它可以被當作一個數組,只要使用&v[0]就可以了。對于string對象s,相應的語法是很簡單的s.c_str()。但只能從上面讀。如廣告時常指明的,有幾個限制。。
給定一個
vector<int> v;
表達式v[0]生產一個指向vector中首元素的引用,所以,&v[0]是指向那個首元素的指針。vector中的元素被C++標準限定為存儲在連續內存中,就象是一個數組,所以,如果我們傳遞v給如此形式的C風格API函數
void doSomething(const int* pInts, size_t numInts);
我們可以這么做:
doSomething(&v[0],v.size());
也許吧。可能吧。唯一的問題就是,如果v是空的。如果這樣的話,v.size()是0,而&v[0]試圖產生一個指向根本就不存在的東西的指針。這不是件好事。其結果未定義。一個較安全的方法是這樣:
if (!v.empty()) {
doSomething(&v[0], v.size());
}
如果走得不對路,你可能會碰到些半瓶子的人物,他們會告訴你說可以用v.begin()代替&v[0],因為(這些討厭的家伙將會告訴你)begin()返回指向vector內部的iterator,而對于vector,其iterators實際上是指針。那經常是正確的,但如Item 50所說,并不總是如此,你不該依賴于此。begin()的返回類型是iterator,而不是一個指針,當你需要一個指向vector內部數據的指針時絕不該使用begin()。如果你基于某些原因決定鍵入v.begin(),就鍵入&*v.begin(), 因為這將會產生和&v[0]相同的指針,雖然它讓你有更多的擊鍵工作且讓代碼讀起來更晦澀。坦白地說,如果你正被告訴你使用v.begin()代替&v[0]的人圍繞的話,你該重新考慮一下你的社交圈了。
類似的從vector上獲取指向內部數據的指針的方法,對string是不可靠的,因為
(1) string中的數據并沒有承諾被存儲在連續內存中,
(2)string的內部表示形式并沒承諾以一個空字符結束。
這解釋了string的成員函數c_str()存在的原因,它返回一個按C風格設計指針,指向string的值(which returns a pointer to the value of the string in a form designed for C)。 我們可以如此傳遞一個string對象s給這個函數,
void doSomething(const char *pString);
就象這樣:
doSomething(s.c_str());
即使是字符串的長度為0,它都能工作。在那種情況下,c_str()將返回一個指向結束符的指針。即使字符串內部自己存在結束符時,它同樣能工作。然而,如果真的這樣,doSomething很可能將第一個結束符解釋為字符串結束。string對象不在意是否容納了結束符,但基于char *的C風格API函數在意。
再看一下doSomething()的申明:
void doSomething(const int* pInts, size_t numInts);
void doSomething(const char *pString);
在兩種形式下,指針都被傳遞為指向const的指針。vector和string的數據被傳給只讀取而不修改它們的API函數。到目前為止都做的是最安全的事情。對于string,這也是唯一可做的,因為沒有承諾說c_str()產生的指針指在string數據的內部表示形式上;它可以返回一個指針指向數據的一個不可修改的拷貝,這個拷貝滿足C風格API函數對格式的要求。(如果這個恐嚇令你寒毛都立起來的話,還請寬心,因為它也許不成立。我沒聽說目前哪個運行庫的實現是使用了這個自由權的。)
對于vector,有更多一點點靈活性。如果你將v傳給一個修改其元素的C風格API函數的話,典型情況都是沒問題,但被調用的函數絕不能試圖改變vector中元素的個數。比如,它絕不能試圖在vector還未使用的容量(capacity)上“創建”新的元素。如果這么干了,v將會變得內部狀態不一致,因為它再也不知道自己的正確大小(size)了。v.size()將會得到一個不正確的結果。并且,如果被調用的函數試圖在一個大小和容量(見Item 14)相等的vector上追加數據的話,真的會發生災難性事件。我甚至根本就不愿去想象它。實在太可怕了。
你注意到我在前面用的是“典型地”一詞嗎?你當然注意到了。有些vector對其數據有些額外的限制,你一定要確保這些額外限制繼續被滿足。舉個例子,Item 23解釋了排序的vector常用來實現關聯容器,但對這些vector而言,保持排序非常重要。如果你將一個排序的vector傳給一個可能修改其數據的API函數,你需要重視vector在調用返回后不再保持排序的情況。
如果你想用C風格API函數返回的元素初始化一個vector,你可以利用vector和數組內在的相容性,通過將存儲vecotr的元素的空間傳給API函數:
// C API: this function takes a pointer to an array of at most arraySize
// doubles and writes data to it. It returns the number of doubles written,
// which is never more than maxNumDoubles.
size_t fillArray(double *pArray, size_t arraySize);
vector<double> vd(maxNumDoubles); // create a vector whose
// size is maxNumDoubles
vd.resize(fillArray(&vd[0], vd.size())); // have fillArray write data
// into vd, then resize vd
// to the number of
// elements fillArray wrote
這個技巧只能工作于vector,因為只有vector承諾了與數組具有相同的內在內存分布。但是,如果你想用來自C風格API函數的數據初始化string對象,你可以做得足夠簡單。只要讓API函數將數據放入一個vector<char>,然后從vector中將數據拷到string:
// C API: this function takes a pointer to an array of at most arraySize
// chars and writes data to it. It returns the number of chars written,
// which is never more than maxNumChars.
size_t fillString(char *pArray, size_t arraySize);
vector<char> vc(maxNumChars); // create a vector whose
// size is maxNumChars
size_t charsWritten = fillString(&vc[0], vc.size()); // have fillString write
// into vc
string s(vc.begin(), vc.begin()+charsWritten); // copy data from vc to s
// via range constructor
// ( see Item 5)
事實上,這個主意總是有效的:讓C風格API函數將數據放入一個vector,然后拷到你實際想要的STL容器中。
size_t fillArray(double *pArray, size_t arraySize); // as above
vector<double> vd(maxNumDoubles); // also as above
vd.resize(fillArray(&vd[0], vd.size());
deque<double> d(vd.begin(), vd.end()); // copy data into
// deque
list<double> l(vd.begin(), vd.end()); // copy data into list
set<double> s(vd.begin(), vd.end()); // copy data into set
此外,這也提示了vector和string以外的STL容器如何將它們的數據傳給C風格API函數。只要將容器的每個數據拷到vector,然后將它們傳給API函數:
void doSomething(const int* pInts, size_t numInts); // C API (from above)
set<int> intSet; // set that will hold
... // data to pass to API
vector<int> v(intSet.begin(), intSet.end()); // copy set data into
// a vector
if (!v.empty()) doSomething(&v[0], v.size()); // pass the data to
// the API
你也可以將數據拷進一個數組,然后將數組傳給C風格的API,但你為什么想這樣做?除非你在編譯期就知道容器的大小,否則你不得不分配動態數組,而Item 13解釋了為什么你應該總是使用vector來取代動態分配的數組。
posted on 2008-06-19 16:13 肥仔 閱讀(454) 評論(0) 編輯 收藏 引用 所屬分類: Boost & STL