• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            Daly的游戲人生

            服務器程序常見bug總結

               最近整理了過去一年發生過的bug,包含跟其他項目組程序朋友交流的例子, 都是大家發生過的真實營運事故。
               游戲服務器程序,很多bug的原因都是共通的。抽象出了以下10點啟示, 作為checklist, 寫下來以后寫程序review時自檢:

            1. 安全邊界問題
                 對于有界限的東西(數值,buffer空間,隊列或一切對象容器),一定要考慮越界判斷。
                 啟示:用snprint, strncpy等限制長度.  永遠都要考慮超過邊界的情況
                           數值加法和乘法:考慮上限溢出; 
                           減法:考慮負數; 除法,判斷分母

            2. 輸入參數非法
                case1: 扣錢邏輯,減去一個負數,變成了加錢。  
                case2: int型大負數相加,負溢出變成大正數
                啟示:test case要全覆蓋輸入參數范圍, 處理各種可能的情況

            3. 上下文改變錯誤
                 共享變量/全局變量被外部改變,這似乎很常見,而且有時很隱蔽。在異步回調的情況下更常見。

                 check A變量 
                 call func_B()
                 ....
                 A變量被func_B改變了, 但繼續信任A變量check的結果。

                啟示:白盒復查代碼時,注意檢查調用后的變化。
                           減少共享變量和全局變量的使用
                           外部接口調用后,注意共享變量的更新和恢復
                 啟示:在最接近執行的地方,檢查上下文變量。不信任調用者,如果效率不關鍵,多一遍冗余檢查沒有壞處

            4. 執行中斷
                 動態腳本拋異常,或者引擎層面的EINTR中斷信號,都有可能中斷代碼執行,需要考慮函數的重入性問題。
                 啟示:要檢查一致性,有些邏輯不允許多次被執行(比如發獎勵),需要有狀態變量確保只執行1次(避免出刷bug)
                 推廣到異步環境(多線程,多進程,各種回調),事務的中斷也有一個重入性問題,解決方法也只有一個:用一個唯一可辨認的狀態變量,保證某些邏輯不會被多次執行(比如購物應用中,用唯一訂單號來識別,狀態改變是一次性的,當邏輯運行多次,也不會重復加物品,或者重復扣錢了)

            5. 終止條件問題--死循環
                 case: 異步環境中,RPC遠程調用,調用成環,邏輯一直不結束。
                 啟示:while或遞歸的終止條件,邏輯全覆蓋檢查,避免死循環。較深層次的互相調用,要注意是否出現了遞歸,是否有可能死循環。

            6. 關聯數據操作的不一致
                 例子:Employee對象有company變量, Company中有employee變量,
                      如果操作改變其中一方,而另一方沒有改變,則造成數據不一致。
                  (數據庫表可以指定constrain, 關聯表刪除, 但代碼變量中需要程序員自己實現)
                   雙向引用的數據一致性問題,要特別注意。
                   為什么要雙向引用?為了查找效率,而避免遍歷其中一方.
                   這個問題本質是數據一致性問題,編程中遇到的很多bug也歸結到這個問題,比如野指針,就是因為數據結構相互引用的操作不一致造成的。
                   處理這個問題,個人經驗是,他們的attach,detach操作盡可能在同一個模塊,不要分散在多個地方隨意修改,所有修改都集中在同一級接口做。

                   同理適用于new, delete, malloc, free這些分配,釋放,都集中在同一層的接口/模塊文件中做,debug起來也容易;非常反感在一個地方new, 然后不知道哪個模塊去delete, 很容易泄漏或者野指針, 無論如何,想辦法傳遞這些指針,一直傳到分配他所在的模塊文件中釋放,而且new和delete的接口代碼要靠近,方便查找問題。

            7. 涉及多玩家,防止筆誤傳錯參數
                 經典錯誤: foreach(uid in team) some_func(usernum, xxx)   
                 經典錯誤:有usernum和target兩個對象,調用函數搞混了。review時要仔細檢查

            8. 特殊分支忘了return
                 異常判斷等if分支忘了return。導致邏輯繼續往下走。這屬于筆誤問題,測試期間未必能留意的到。

            9. 異步返回沒清變量
                對于異步操作,如果在返回時清變量,這時如果不能保證把變量清掉(比如期間玩家下線無法離線修改該變量),就會出刷。
                啟示:對于已獎勵標記,一定要保證各種情況下領獎后能正確記錄。

            10. 瞬爆容量上限
                 case1:  網絡待發送隊列,因為瞬間大量請求,塞滿拋異常,導致流程受影響。
                 case2:  大量連接請求,listen的accept沒有規定單次讀事件的accept,用了while(true), 導致爆機
                            在listen fd的讀事件回調中, 通常會accept所有新的連接請求,如果用while(true)而不設一個上限,就有可能被攻擊(想象一下客戶端也用一個死循環來做connect)。
                            一方面要限制單次接受的socket次數, 另外各個狀態要有超時機制,踢掉不尋常的連接,以防被攻擊占盡資源。

                 case3: 異步情況下,要限制操作者連續頻繁的操作。(比如在請求入口處增加最少時間間隔限制,避免玩家狂點,形成雪崩效應)
                            (同時要考慮用戶體驗,不要讓玩家死等,可以做一個提示跳轉,或者等候的動畫)

            參考資料:
            附上最近看的一篇文章
            <Writing-reliable-online-game-services> 作者曾是魔獸爭霸和星際爭霸,battle.net的開發者,
            里面講的point也是游戲里經常遇到的可靠性問題。
            http://www.codeofhonor.com/blog/wp-content/uploads/2012/04/Patrick-Wyatt-Writing-reliable-online-game-services.pdf



            posted on 2012-11-30 14:14 Daly 閱讀(2352) 評論(5)  編輯 收藏 引用 所屬分類: 游戲開發

            評論

            # re: 服務器程序常見bug總結 2012-12-01 23:11 Jcilz

            有共鳴,總結得很實際,頂。  回復  更多評論   

            # re: 服務器程序常見bug總結 2012-12-04 16:39 譚軍

            listen的accept沒有規定單次讀事件的accept,用了while(true), 導致爆機,
            這個是什么意思啊?  回復  更多評論   

            # re: 服務器程序常見bug總結 2012-12-07 12:31 Daly

            @譚軍
            一般用epoll等event驅動的典型寫法是,listen的fd有讀事件,那么在回調函數里就會accept一個新socket, 如果是 while(true) { accept() }不斷接受新連接, 就有可能被攻擊。假如管理socket的容器沒有加上限,就會爆滿。  回復  更多評論   

            # re: 服務器程序常見bug總結 2013-05-08 14:11 egmkang

            那是因為你listen設置的backlog值太大了吧  回復  更多評論   

            # re: 服務器程序常見bug總結 2013-10-08 12:14 coderchen

            @egmkang

            listen設置的backlog是第一次和第三次握手的兩個隊列之和吧。我感覺博主說的對,如果有個客戶端不停的connect,服務器while中accept就悲劇了。  回復  更多評論   

            久久久久久夜精品精品免费啦| 久久久久女教师免费一区| 人妻精品久久无码区| 久久ZYZ资源站无码中文动漫 | 久久国产精品无码网站| 亚洲欧美一区二区三区久久| 久久婷婷色综合一区二区| 久久国产乱子伦免费精品| 狠狠精品干练久久久无码中文字幕 | 久久国产免费直播| 久久精品国产亚洲av麻豆色欲| 99久久国产免费福利| 久久久久久久精品成人热色戒| 久久精品国产99国产电影网 | 国产一区二区精品久久岳| 欧美精品乱码99久久蜜桃| 国内精品伊人久久久久| 亚洲人成无码www久久久| 精品国产乱码久久久久久郑州公司| 久久久精品国产Sm最大网站| 久久久久亚洲Av无码专| 老司机午夜网站国内精品久久久久久久久 | 久久综合九色综合欧美狠狠| 狠狠色丁香婷婷久久综合| 久久久久久狠狠丁香| 亚洲伊人久久大香线蕉综合图片| 久久e热在这里只有国产中文精品99 | 久久久久这里只有精品 | 精品欧美一区二区三区久久久| 亚洲精品美女久久777777| 国产高清国内精品福利99久久| 久久夜色精品国产网站| 久久成人小视频| 久久久久亚洲?V成人无码| 久久精品无码一区二区三区| 亚洲AV无码久久精品成人| 污污内射久久一区二区欧美日韩 | 精品久久综合1区2区3区激情| 久久99热精品| 精品国际久久久久999波多野| 无码专区久久综合久中文字幕|