對(duì)于有界限的東西(數(shù)值,buffer空間,隊(duì)列或一切對(duì)象容器),一定要考慮越界判斷。
啟示:用snprint, strncpy等限制長(zhǎng)度. 永遠(yuǎn)都要考慮超過(guò)邊界的情況
數(shù)值加法和乘法:考慮上限溢出;
減法:考慮負(fù)數(shù); 除法,判斷分母
2. 輸入?yún)?shù)非法
case1: 扣錢(qián)邏輯,減去一個(gè)負(fù)數(shù),變成了加錢(qián)。
case2: int型大負(fù)數(shù)相加,負(fù)溢出變成大正數(shù)
啟示:test case要全覆蓋輸入?yún)?shù)范圍, 處理各種可能的情況
3. 上下文改變錯(cuò)誤
共享變量/全局變量被外部改變,這似乎很常見(jiàn),而且有時(shí)很隱蔽。在異步回調(diào)的情況下更常見(jiàn)。
check A變量
call func_B()
....
A變量被func_B改變了, 但繼續(xù)信任A變量check的結(jié)果。
啟示:白盒復(fù)查代碼時(shí),注意檢查調(diào)用后的變化。
減少共享變量和全局變量的使用
外部接口調(diào)用后,注意共享變量的更新和恢復(fù)
啟示:在最接近執(zhí)行的地方,檢查上下文變量。不信任調(diào)用者,如果效率不關(guān)鍵,多一遍冗余檢查沒(méi)有壞處
4. 執(zhí)行中斷
動(dòng)態(tài)腳本拋異常,或者引擎層面的EINTR中斷信號(hào),都有可能中斷代碼執(zhí)行,需要考慮函數(shù)的重入性問(wèn)題。
啟示:要檢查一致性,有些邏輯不允許多次被執(zhí)行(比如發(fā)獎(jiǎng)勵(lì)),需要有狀態(tài)變量確保只執(zhí)行1次(避免出刷bug)
推廣到異步環(huán)境(多線程,多進(jìn)程,各種回調(diào)),事務(wù)的中斷也有一個(gè)重入性問(wèn)題,解決方法也只有一個(gè):用一個(gè)唯一可辨認(rèn)的狀態(tài)變量,保證某些邏輯不會(huì)被多次執(zhí)行(比如購(gòu)物應(yīng)用中,用唯一訂單號(hào)來(lái)識(shí)別,狀態(tài)改變是一次性的,當(dāng)邏輯運(yùn)行多次,也不會(huì)重復(fù)加物品,或者重復(fù)扣錢(qián)了)
5. 終止條件問(wèn)題--死循環(huán)
case: 異步環(huán)境中,RPC遠(yuǎn)程調(diào)用,調(diào)用成環(huán),邏輯一直不結(jié)束。
啟示:while或遞歸的終止條件,邏輯全覆蓋檢查,避免死循環(huán)。較深層次的互相調(diào)用,要注意是否出現(xiàn)了遞歸,是否有可能死循環(huán)。
6. 關(guān)聯(lián)數(shù)據(jù)操作的不一致
例子:Employee對(duì)象有company變量, Company中有employee變量,
如果操作改變其中一方,而另一方?jīng)]有改變,則造成數(shù)據(jù)不一致。
(數(shù)據(jù)庫(kù)表可以指定constrain, 關(guān)聯(lián)表刪除, 但代碼變量中需要程序員自己實(shí)現(xiàn))
雙向引用的數(shù)據(jù)一致性問(wèn)題,要特別注意。
為什么要雙向引用?為了查找效率,而避免遍歷其中一方.
這個(gè)問(wèn)題本質(zhì)是數(shù)據(jù)一致性問(wèn)題,編程中遇到的很多bug也歸結(jié)到這個(gè)問(wèn)題,比如野指針,就是因?yàn)閿?shù)據(jù)結(jié)構(gòu)相互引用的操作不一致造成的。
處理這個(gè)問(wèn)題,個(gè)人經(jīng)驗(yàn)是,他們的attach,detach操作盡可能在同一個(gè)模塊,不要分散在多個(gè)地方隨意修改,所有修改都集中在同一級(jí)接口做。
同理適用于new, delete, malloc, free這些分配,釋放,都集中在同一層的接口/模塊文件中做,debug起來(lái)也容易;非常反感在一個(gè)地方new, 然后不知道哪個(gè)模塊去delete, 很容易泄漏或者野指針, 無(wú)論如何,想辦法傳遞這些指針,一直傳到分配他所在的模塊文件中釋放,而且new和delete的接口代碼要靠近,方便查找問(wèn)題。
7. 涉及多玩家,防止筆誤傳錯(cuò)參數(shù)
經(jīng)典錯(cuò)誤: foreach(uid in team) some_func(usernum, xxx)
經(jīng)典錯(cuò)誤:有usernum和target兩個(gè)對(duì)象,調(diào)用函數(shù)搞混了。review時(shí)要仔細(xì)檢查
8. 特殊分支忘了return
異常判斷等if分支忘了return。導(dǎo)致邏輯繼續(xù)往下走。這屬于筆誤問(wèn)題,測(cè)試期間未必能留意的到。
9. 異步返回沒(méi)清變量
對(duì)于異步操作,如果在返回時(shí)清變量,這時(shí)如果不能保證把變量清掉(比如期間玩家下線無(wú)法離線修改該變量),就會(huì)出刷。
啟示:對(duì)于已獎(jiǎng)勵(lì)標(biāo)記,一定要保證各種情況下領(lǐng)獎(jiǎng)后能正確記錄。
10. 瞬爆容量上限
case1: 網(wǎng)絡(luò)待發(fā)送隊(duì)列,因?yàn)樗查g大量請(qǐng)求,塞滿拋異常,導(dǎo)致流程受影響。
case2: 大量連接請(qǐng)求,listen的accept沒(méi)有規(guī)定單次讀事件的accept,用了while(true), 導(dǎo)致爆機(jī)
在listen fd的讀事件回調(diào)中, 通常會(huì)accept所有新的連接請(qǐng)求,如果用while(true)而不設(shè)一個(gè)上限,就有可能被攻擊(想象一下客戶端也用一個(gè)死循環(huán)來(lái)做connect)。
一方面要限制單次接受的socket次數(shù), 另外各個(gè)狀態(tài)要有超時(shí)機(jī)制,踢掉不尋常的連接,以防被攻擊占盡資源。
case3: 異步情況下,要限制操作者連續(xù)頻繁的操作。(比如在請(qǐng)求入口處增加最少時(shí)間間隔限制,避免玩家狂點(diǎn),形成雪崩效應(yīng))
(同時(shí)要考慮用戶體驗(yàn),不要讓玩家死等,可以做一個(gè)提示跳轉(zhuǎn),或者等候的動(dòng)畫(huà))
參考資料:
附上最近看的一篇文章
<Writing-reliable-online-game-services> 作者曾是魔獸爭(zhēng)霸和星際爭(zhēng)霸,battle.net的開(kāi)發(fā)者,
里面講的point也是游戲里經(jīng)常遇到的可靠性問(wèn)題。
http://www.codeofhonor.com/blog/wp-content/uploads/2012/04/Patrick-Wyatt-Writing-reliable-online-game-services.pdf