• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            陳碩的Blog

            C++ 工程實踐(4):二進制兼容性

            陳碩 (giantchen_AT_gmail)

            Blog.csdn.net/Solstice

            本文主要討論 Linux x86/x86-64 平臺,偶爾會舉 Windows 作為反面教材。

            C/C++ 的二進制兼容性 (binary compatibility) 有多重含義,本文主要在“頭文件和庫文件分別升級,可執(zhí)行文件是否受影響”這個意義下討論,我稱之為 library (主要是 shared library,即動態(tài)鏈接庫)的 ABI (application binary interface)。至于編譯器與操作系統(tǒng)的 ABI 留給下一篇談 C++ 標準與實踐的文章。

            什么是二進制兼容性

            在解釋這個定義之前,先看看 Unix/C 語言的一個歷史問題:open() 的 flags 參數(shù)的取值。open(2) 函數(shù)的原型是

            int open(const char *pathname, int flags);

            其中 flags 的取值有三個: O_RDONLY,  O_WRONLY,  O_RDWR。

            與一般人的直覺相反,這幾個值不是按位或 (bitwise-OR) 的關(guān)系,即 O_RDONLY | O_WRONLY != O_RDWR。如果你想以讀寫方式打開文件,必須用 O_RDWR,而不能用 (O_RDONLY | O_WRONLY)。為什么?因為 O_RDONLY, O_WRONLY, O_RDWR 的值分別是 0, 1, 2。它們不滿足按位或

            那么為什么 C 語言從誕生到現(xiàn)在一直沒有糾正這個不足之處?比方說把 O_RDONLY, O_WRONLY, O_RDWR 分別定義為 1, 2, 3,這樣 O_RDONLY | O_WRONLY == O_RDWR,符合直覺。而且這三個值都是宏定義,也不需要修改現(xiàn)有的源代碼,只需要改改系統(tǒng)的頭文件就行了。

            因為這么做會破壞二進制兼容性。對于已經(jīng)編譯好的可執(zhí)行文件,它調(diào)用 open(2) 的參數(shù)是寫死的,更改頭文件并不能影響已經(jīng)編譯好的可執(zhí)行文件。比方說這個可執(zhí)行文件會調(diào)用 open(path, 1) 來文件,而在新規(guī)定中,這表示文件,程序就錯亂了。

            以上這個例子說明,如果以 shared library 方式提供函數(shù)庫,那么頭文件和庫文件不能輕易修改,否則容易破壞已有的二進制可執(zhí)行文件,或者其他用到這個 shared library 的 library。操作系統(tǒng)的 system call 可以看成 Kernel 與 User space 的 interface,kernel 在這個意義下也可以當成 shared library,你可以把內(nèi)核從 2.6.30 升級到 2.6.35,而不需要重新編譯所有用戶態(tài)的程序。

            所謂“二進制兼容性”指的就是在升級(也可能是 bug fix)庫文件的時候,不必重新編譯使用這個庫的可執(zhí)行文件或使用這個庫的其他庫文件,程序的功能不被破壞。

            見 QT FAQ 的有關(guān)條款:http://developer.qt.nokia.com/faq/answer/you_frequently_say_that_you_cannot_add_this_or_that_feature_because_it_woul

            在 Windows 下有惡名叫 DLL Hell,比如 MFC 有一堆 DLL,mfc40.dll, mfc42.dll, mfc71.dll, mfc80.dll, mfc90.dll,這是動態(tài)鏈接庫的本質(zhì)問題,怪不到 MFC 頭上。

            有哪些情況會破壞庫的 ABI

            到底如何判斷一個改動是不是二進制兼容呢?這跟 C++ 的實現(xiàn)方式直接相關(guān),雖然 C++ 標準沒有規(guī)定 C++ 的 ABI,但是幾乎所有主流平臺都有明文或事實上的 ABI 標準。比方說 ARM 有 EABI,Intel Itanium 有 http://www.codesourcery.com/public/cxx-abi/abi.html,x86-64 有仿 Itanium 的 ABI,SPARC 和 MIPS 也都有明文規(guī)定的 ABI,等等。x86 是個例外,它只有事實上的 ABI,比如 Windows 就是 Visual C++,Linux 是 G++(G++ 的 ABI 還有多個版本,目前最新的是 G++ 3.4 的版本),Intel 的 C++ 編譯器也得按照 Visual C++ 或 G++ 的 ABI 來生成代碼,否則就不能與系統(tǒng)其它部件兼容。

            C++ ABI 的主要內(nèi)容:

            • 函數(shù)參數(shù)傳遞的方式,比如 x86-64 用寄存器來傳函數(shù)的前 4 個整數(shù)參數(shù)
            • 虛函數(shù)的調(diào)用方式,通常是 vptr/vtbl 然后用 vtbl[offset] 來調(diào)用
            • struct 和 class 的內(nèi)存布局,通過偏移量來訪問數(shù)據(jù)成員
            • name mangling
            • RTTI 和異常處理的實現(xiàn)(以下本文不考慮異常處理)

            C/C++ 通過頭文件暴露出動態(tài)庫的使用方法,這個“使用方法”主要是給編譯器看的,編譯器會據(jù)此生成二進制代碼,然后在運行的時候通過裝載器(loader)把可執(zhí)行文件和動態(tài)庫綁到一起。如何判斷一個改動是不是二進制兼容,主要就是看頭文件暴露的這份“使用說明”能否與新版本的動態(tài)庫的實際使用方法兼容。因為新的庫必然有新的頭文件,但是現(xiàn)有的二進制可執(zhí)行文件還是按舊的頭文件來調(diào)用動態(tài)庫。

            這里舉一些源代碼兼容但是二進制代碼不兼容例子

            • 給函數(shù)增加默認參數(shù),現(xiàn)有的可執(zhí)行文件無法傳這個額外的參數(shù)。
            • 增加虛函數(shù),會造成 vtbl 里的排列變化。(不要考慮“只在末尾增加”這種取巧行為,因為你的 class 可能已被繼承。)
            • 增加默認模板類型參數(shù),比方說 Foo<T> 改為 Foo<T, Alloc=alloc<T> >,這會改變 name mangling
            • 改變 enum 的值,把 enum Color { Red = 3 }; 改為 Red = 4。這會造成錯位。當然,由于 enum 自動排列取值,添加 enum 項也是不安全的,除非是在末尾添加。

            給 class Bar 增加數(shù)據(jù)成員,造成 sizeof(Bar) 變大,以及內(nèi)部數(shù)據(jù)成員的 offset 變化,這是不是安全的?通常不是安全的,但也有例外。

            • 如果客戶代碼里有 new Bar,那么肯定不安全,因為 new 的字節(jié)數(shù)不夠裝下新 Bar。相反,如果 library 通過 factory 返回 Bar* (并通過 factory 來銷毀對象)或者直接返回 shared_ptr<Bar>,客戶端不需要用到 sizeof(Bar),那么可能是安全的。
            • 如果客戶代碼里有 Bar* pBar; pBar->memberA = xx;,那么肯定不安全,因為 memberA 的新 Bar 的偏移可能會變。相反,如果只通過成員函數(shù)來訪問對象的數(shù)據(jù)成員,客戶端不需要用到 data member 的 offsets,那么可能是安全的。
            • 如果客戶調(diào)用 pBar->setMemberA(xx); 而 Bar::setMemberA() 是個 inline function,那么肯定不安全,因為偏移量已經(jīng)被 inline 到客戶的二進制代碼里了。如果 setMemberA() 是 outline function,其實現(xiàn)位于 shared library 中,會隨著 Bar 的更新而更新,那么可能是安全的。

            那么只使用 header-only 的庫文件是不是安全呢?不一定。如果你的程序用了 boost 1.36.0,而你依賴的某個 library 在編譯的時候用的是 1.33.1,那么你的程序和這個 library 就不能正常工作。因為 1.36.0 和 1.33.1 的 boost::function 的模板參數(shù)類型的個數(shù)不一樣,其中一個多了 allocator。

            這里有一份黑名單,列在這里的肯定是二級制不兼容,沒有列出的也可能二進制不兼容,見 KDE 的文檔:http://techbase.kde.org/Policies/Binary_Compatibility_Issues_With_C%2B%2B

             

            哪些做法多半是安全的

            前面我說“不能輕易修改”,暗示有些改動多半是安全的,這里有一份白名單,歡迎添加更多內(nèi)容。

            只要庫改動不影響現(xiàn)有的可執(zhí)行文件的二進制代碼的正確性,那么就是安全的,我們可以先部署新的庫,讓現(xiàn)有的二進制程序受益。

            • 增加新的 class
            • 增加 non-virtual 成員函數(shù)
            • 修改數(shù)據(jù)成員的名稱,因為生產(chǎn)的二進制代碼是按偏移量來訪問的,當然,這會造成源碼級的不兼容。
            • 還有很多,不一一列舉了。

            歡迎補充

            反面教材:COM

            在 C++ 中以虛函數(shù)作為接口基本上就跟二進制兼容性說拜拜了。具體地說,以只包含虛函數(shù)的 class (稱為 interface class)作為程序庫的接口,這樣的接口是僵硬的,一旦發(fā)布,無法修改。

            比方說 M$ 的 COM,其 DirectX 和 MSXML 都以 COM 組件方式發(fā)布,我們來看看它的帶版本接口 (versioned interfaces):

            • IDirect3D7, IDirect3D8, IDirect3D9, ID3D10*, ID3D11*
            • IXMLDOMDocument, IXMLDOMDocument2, IXMLDOMDocument3

            換話句話說,每次發(fā)布新版本都引入新的 interface class,而不是在現(xiàn)有的 interface 上做擴充。這樣一樣不能兼容現(xiàn)有的代碼,強迫客戶端代碼也要改寫。

            回過頭來看看 C 語言,C/Posix 這些年逐漸加入了很多新函數(shù),同時,現(xiàn)有的代碼不用修改也能運行得很好。如果要用這些新函數(shù),直接用就行了,也基本不會修改已有的代碼。相反,COM 里邊要想用 IXMLDOMDocument3 的功能,就得把現(xiàn)有的代碼從 IXMLDOMDocument 全部升級到 IXMLDOMDocument3,很諷刺吧。

            tip:如果遇到鼓吹在 C++ 里使用面向接口編程的人,可以拿二進制兼容性考考他。

            解決辦法

            采用靜態(tài)鏈接

            這個是王道。在分布式系統(tǒng)這,采用靜態(tài)鏈接也帶來部署上的好處,只要把可執(zhí)行文件放到機器上就行運行,不用考慮它依賴的 libraries。目前 muduo 就是采用靜態(tài)鏈接。

            通過動態(tài)庫的版本管理來控制兼容性

            這需要非常小心檢查每次改動的二進制兼容性并做好發(fā)布計劃,比如 1.0.x 系列做到二進制兼容,1.1.x 系列做到二進制兼容,而 1.0.x 和 1.1.x 二進制不兼容。《程序員的自我修養(yǎng)》里邊講過 .so 文件的命名與二進制兼容性相關(guān)的話題,值得一讀。 

            用 pimpl 技法,編譯器防火墻

            在頭文件中只暴露 non-virtual 接口,并且 class 的大小固定為 sizeof(Impl*),這樣可以隨意更新庫文件而不影響可執(zhí)行文件。當然,這么做有多了一道間接性,可能有一定的性能損失。見 Exceptional C++ 有關(guān)條款和 C++ Coding Standards 101.

            Java 是如何應對的

            Java 實際上把 C/C++ 的 linking 這一步驟推遲到 class loading 的時候來做。就不存在“不能增加虛函數(shù)”,“不能修改 data member” 等問題。在 Java 里邊用面向 interface 編程遠比 C++ 更通用和自然,也沒有上面提到的“僵硬的接口”問題。

            (待續(xù))

            posted on 2011-03-09 10:48 陳碩 閱讀(13208) 評論(6)  編輯 收藏 引用

            評論

            # re: C++ 工程實踐(4):二進制兼容性 2011-03-09 15:02 素素

            第一個例子主要原因還是因為很多人在寫的時候根本不用常量宏,而直接用常數(shù)0,1,2代表標準輸入|輸出|錯誤吧,這樣代碼級也不兼容了。  回復  更多評論   

            # re: C++ 工程實踐(4):二進制兼容性 2011-03-09 17:43 vczh

            那還不是因為升級的時候不想更新所有dll嗎。如果你的源代碼都是同一個編譯器出來,而且升級不會試圖偷懶,那有什么所謂呢。

            不過qq什么的就除外了,最好dll做成extern"C",可以少掉很多問題,因為很多feature在h里面不能出現(xiàn)了,強迫自己包裝。  回復  更多評論   

            # re: C++ 工程實踐(4):二進制兼容性[未登錄] 2011-03-09 18:35 vincent

            @素素
            常量宏本質(zhì)上也只是0,1,2啊
            在已編譯的可執(zhí)行程序中就是0,1,2
            這個時候如果是動態(tài)鏈接crt的dll,那自然有問題啊,這就是ABI的二進制不兼容


              回復  更多評論   

            # re: C++ 工程實踐(4):二進制兼容性 2011-03-09 23:29 陳碩

            @vczh
            不是偷不偷懶的問題。假設(shè)你是一個 shared library 的維護者,你的 library 被另外兩三個團隊使用了。你發(fā)現(xiàn)了一個安全漏洞,或者某個會導致 crash 的 bug 需要修復,那么你修復之后,能不能直接部署 library 的二進制文件?有沒有破壞二進制兼容性?會不會破壞別人團隊已經(jīng)編譯好的投入使用的可執(zhí)行文件?是不是要強迫別的團隊重新編譯鏈接,把可執(zhí)行文件也發(fā)布新版本?會不會打亂別人的 release cycle?這些都是工程開發(fā)中應該考慮的問題。  回復  更多評論   

            # re: C++ 工程實踐(4):二進制兼容性 2011-03-10 11:50 haohao06

            個人感覺com主要是為了跨語言的二進制復用.  回復  更多評論   

            # re: C++ 工程實踐(4):二進制兼容性 2011-03-10 22:21 qiuxiafei

            @陳碩
            確實,比如兩個項目在并行開發(fā),不考慮二進制兼容性往往除是經(jīng)常需要編譯依賴庫》。  回復  更多評論   

            <2025年5月>
            27282930123
            45678910
            11121314151617
            18192021222324
            25262728293031
            1234567

            導航

            統(tǒng)計

            常用鏈接

            隨筆分類

            隨筆檔案

            相冊

            搜索

            最新評論

            閱讀排行榜

            評論排行榜

            久久久久国色AV免费看图片| 久久综合伊人77777| 一本久久综合亚洲鲁鲁五月天亚洲欧美一区二区 | 久久久久久夜精品精品免费啦| 久久久黄片| 久久婷婷五月综合成人D啪| 久久久久久狠狠丁香| 久久精品国产久精国产思思| 久久久久高潮毛片免费全部播放| 久久亚洲国产成人精品性色| 国产精品一区二区久久不卡| 久久久久亚洲精品无码蜜桃| 中文字幕乱码人妻无码久久| 婷婷综合久久中文字幕蜜桃三电影 | 欧美va久久久噜噜噜久久| 天天爽天天狠久久久综合麻豆| 久久精品国产第一区二区三区 | 久久精品夜夜夜夜夜久久| 久久人爽人人爽人人片AV| av无码久久久久不卡免费网站| aaa级精品久久久国产片| 精品无码久久久久久国产| 久久亚洲色一区二区三区| 狠狠色丁香久久婷婷综合图片| 久久精品国产亚洲AV久| 国内精品伊人久久久久AV影院| 国产午夜久久影院| 人妻无码精品久久亚瑟影视| 久久天天躁狠狠躁夜夜avapp| 久久久久人妻精品一区二区三区 | 久久综合丝袜日本网| 久久亚洲电影| 99国产欧美精品久久久蜜芽| 久久精品成人免费国产片小草| 国产69精品久久久久久人妻精品| 国产精品久久成人影院| 尹人香蕉久久99天天拍| 国产一级持黄大片99久久| 亚洲中文字幕伊人久久无码 | 精品久久久久久久无码| 久久青青国产|