條款9:在刪除選項中仔細選擇
假定你有一個標(biāo)準(zhǔn)STL容器,c,容納int,
Container<int> c;
而你想把c中所有值為1963的對象都去掉。令人吃驚的是,完成這項任務(wù)的方法因不同的容器類型而不同:沒有一種方法是通用的。
如果你有一個連續(xù)內(nèi)存容器(vector、deque或string——參見條款1),最好的方法是erase-remove慣用法(參見條款32):
c.erase(remove(c.begin(), c.end(), 1963), // 當(dāng)c是vector、string
c.end()); // 或deque時,
// erase-remove慣用法
// 是去除特定值的元素
// 的最佳方法
這方法也適合于list,但是,正如條款44解釋的,list的成員函數(shù)remove更高效:
c.remove(1963); // 當(dāng)c是list時,
// remove成員函數(shù)是去除
// 特定值的元素的最佳方法
當(dāng)c是標(biāo)準(zhǔn)關(guān)聯(lián)容器(即,set、multiset、map或multimap)時,使用任何叫做remove的東西都是完全錯誤的。這樣的容器沒有叫做remove的成員函數(shù),而且使用remove算法可能覆蓋容器值(參見條款32),潛在地破壞容器。(關(guān)于這樣的破壞的細節(jié),參考條款22,那個條款也解釋了為什么試圖在map和multimap上使用remove肯定不能編譯,而試圖在set和multiset上使用可能不能編譯。)
不,對于關(guān)聯(lián)容器,解決問題的適當(dāng)方法是調(diào)用erase:
c.erase(1963); // 當(dāng)c是標(biāo)準(zhǔn)關(guān)聯(lián)容器時
// erase成員函數(shù)是去除
// 特定值的元素的最佳方法
這不僅是正確的,而且很高效,只花費對數(shù)時間。(序列容器的基于刪除的技術(shù)需要線性時間。)并且,關(guān)聯(lián)容器的erase成員函數(shù)有基于等價而不是相等的優(yōu)勢,條款19解釋了這一區(qū)別的重要性。
讓我們現(xiàn)在稍微修改一下這個問題。不是從c中除去每個有特定值的物體,讓我們消除下面判斷式(參見條款39)返回真的每個對象:
bool badValue(int x); // 返回x是否是“bad”
對于序列容器(vector、string、deque和list),我們要做的只是把每個remove替換為remove_if,然后就完成了:
c.erase(remove_if(c.begin(), c.end(), badValue), // 當(dāng)c是vector、string
c.end()); // 或deque時這是去掉
// badValue返回真
// 的對象的最佳方法
c.remove_if(badValue); // 當(dāng)c是list時這是去掉
// badValue返回真
// 的對象的最佳方法
對于標(biāo)準(zhǔn)關(guān)聯(lián)容器,它不是很直截了當(dāng)。有兩種方法處理該問題,一個更容易編碼,另一個更高效。“更容易但效率較低”的解決方案用remove_copy_if把我們需要的值拷貝到一個新容器中,然后把原容器的內(nèi)容和新的交換:
AssocContainer<int> c; // c現(xiàn)在是一種
... // 標(biāo)準(zhǔn)關(guān)聯(lián)容器
AssocContainer<int> goodValues; // 用于容納不刪除
// 的值的臨時容器
remove_copy_if(c.begin(), c.end(), // 從c拷貝不刪除
inserter(goodValues, // 的值到
goodValues.end()), // goodValues
badValue);
c.swap(goodValues); // 交換c和goodValues
// 的內(nèi)容
對這種方法的缺點是它拷貝了所有不刪除的元素,而這樣的拷貝開銷可能大于我們感興趣支付的。
我們可以通過直接從原容器刪除元素來避開那筆帳單。不過,因為關(guān)聯(lián)容器沒有提供類似remove_if的成員函數(shù),所以我們必須寫一個循環(huán)來迭代c中的元素,和原來一樣刪除元素。
看起來,這個任務(wù)很簡單,而且實際上,代碼也很簡單。不幸的是,那些正確工作的代碼很少是躍出腦海的代碼。例如,這是很多程序員首先想到的:
AssocContainer<int> c;
...
for (AssocContainer<int>::iterator i = c.begin(); // 清晰,直截了當(dāng)
i!= c.end(); // 而漏洞百出的用于
++i) { // 刪除c中badValue返回真
if (badValue(*i)) c.erase(i); // 的每個元素的代碼
} // 不要這么做!
唉,這有未定義的行為。當(dāng)容器的一個元素被刪時,指向那個元素的所有迭代器都失效了。當(dāng)c.erase(i)返回時,i已經(jīng)失效。那對于這個循環(huán)是個壞消息,因為在erase返回后,i通過for循環(huán)的++i部分自增。
為了避免這個問題,我們必須保證在調(diào)用erase之前就得到了c中下一元素的迭代器。最容易的方法是當(dāng)我們調(diào)用時在i上使用后置遞增:
AssocContainer<int> c;
...
for (AssocContainer<int>::iterator i = c.begin(); // for循環(huán)的第三部分
i != c.end(); // 是空的;i現(xiàn)在在下面
/*nothing*/ ){ // 自增
if (badValue(*i)) c.erase(i++); // 對于壞的值,把當(dāng)前的
else ++i; // i傳給erase,然后
} // 作為副作用增加i;
// 對于好的值,
// 只增加i
這種調(diào)用erase的解決方法可以工作,因為表達式i++的值是i的舊值,但作為副作用,i增加了。因此,我們把i的舊值(沒增加的)傳給erase,但在erase開始執(zhí)行前i已經(jīng)自增了。那正好是我們想要的。正如我所說的,代碼很簡單,只不過不是大多數(shù)程序員在第一次嘗試時想到的。
現(xiàn)在讓我們進一步修改該問題。不僅刪除badValue返回真的每個元素,而且每當(dāng)一個元素被刪掉時,我們也想把一條消息寫到日志文件中。
對于關(guān)聯(lián)容器,這說多容易就有多容易,因為只需要對我們剛才開發(fā)的循環(huán)做一個微不足道的修改就行了:
ofstream logFile; // 要寫入的日志文件
AssocContainer<int> c;
...
for (AssocContainer<int>::iterator i = c.begin(); // 循環(huán)條件和前面一樣
i !=c.end();){
if (badValue(*i)){
logFile << "Erasing " << *i <<'\n'; // 寫日志文件
c.erase(i++); // 刪除元素
}
else ++i;
}
現(xiàn)在是vector、string和deque給我們帶來麻煩。我們不能再使用erase-remove慣用法,因為沒有辦法讓erase或remove寫日志文件。而且,我們不能使用剛剛為關(guān)聯(lián)容器開發(fā)的循環(huán),因為它為vector、string和deque產(chǎn)生未定義的行為!要記得對于那樣的容器,調(diào)用erase不僅使所有指向被刪元素的迭代器失效,也使被刪元素之后的所有迭代器失效。在我們的情況里,那包括所有i之后的迭代器。我們寫i++,++i或你能想起的其它任何東西都沒有用,因為沒有能導(dǎo)致迭代器有效的。
我們必須對vector、string和deque采用不同的戰(zhàn)略。特別是,我們必須利用erase的返回值。那個返回值正是我們需要的:一旦刪除完成,它就是指向緊接在被刪元素之后的元素的有效迭代器。換句話說,我們這么寫:
for (SeqContainer<int>::iterator i = c.begin();
i != c.end();){
if (badValue(*i)){
logFile << "Erasing " << *i << '\n';
i = c.erase(i); // 通過把erase的返回值
} // 賦給i來保持i有效
else
++i;
}
這可以很好地工作,但只用于標(biāo)準(zhǔn)序列容器。由于論證一個可能的問題(條款5做了),標(biāo)準(zhǔn)關(guān)聯(lián)容器的erase的返回類型是void[1]。對于那些容器,你必須使用“后置遞增你要傳給erase的迭代器”技術(shù)。(順便說說,在為序列容器編碼和為關(guān)聯(lián)容器編碼之間的這種差別是為什么寫容器無關(guān)代碼一般缺乏考慮的一個例子——參見條款2。)
為了避免你奇怪list的適當(dāng)方法是什么,事實表明對于迭代和刪除,你可以像vector/string/deque一樣或像關(guān)聯(lián)容器一樣對待list;兩種方法都可以為list工作。
如果我們觀察在本條款中提到的所有東西,我們得出下列結(jié)論:
- 去除一個容器中有特定值的所有對象:
如果容器是vector、string或deque,使用erase-remove慣用法。
如果容器是list,使用list::remove。
如果容器是標(biāo)準(zhǔn)關(guān)聯(lián)容器,使用它的erase成員函數(shù)。
- 去除一個容器中滿足一個特定判定式的所有對象:
如果容器是vector、string或deque,使用erase-remove_if慣用法。
如果容器是list,使用list::remove_if。
如果容器是標(biāo)準(zhǔn)關(guān)聯(lián)容器,使用remove_copy_if和swap,或?qū)懸粋€循環(huán)來遍歷容器元素,當(dāng)你把迭代器傳給erase時記得后置遞增它。
- 在循環(huán)內(nèi)做某些事情(除了刪除對象之外):
如果容器是標(biāo)準(zhǔn)序列容器,寫一個循環(huán)來遍歷容器元素,每當(dāng)調(diào)用erase時記得都用它的返回值更新你的迭代器。
如果容器是標(biāo)準(zhǔn)關(guān)聯(lián)容器,寫一個循環(huán)來遍歷容器元素,當(dāng)你把迭代器傳給erase時記得后置遞增它。
如你所見,與僅僅調(diào)用erase相比,有效地刪除容器元素有更多的東西。解決問題的最好方法取決于你是怎樣鑒別出哪個對象是要被去掉的,儲存它們的容器的類型,和當(dāng)你刪除它們的時候你還想要做什么(如果有的話)。只要你小心而且注意了本條款的建議,你將毫不費力。如果你不小心,你將冒著產(chǎn)生不必要低效的代碼或未定義行為的危險。
[1] 這僅對帶有迭代器實參的erase形式是正確的。關(guān)聯(lián)容器也提供一個帶有一個值的實參的erase形式,而那種形式返回被刪掉的元素個數(shù)。但這里,我們只關(guān)心通過迭代器刪除東西。