• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            陳碩的Blog

            C++ 工程實(shí)踐(4):二進(jìn)制兼容性

            陳碩 (giantchen_AT_gmail)

            Blog.csdn.net/Solstice

            本文主要討論 Linux x86/x86-64 平臺(tái),偶爾會(huì)舉 Windows 作為反面教材。

            C/C++ 的二進(jìn)制兼容性 (binary compatibility) 有多重含義,本文主要在“頭文件和庫(kù)文件分別升級(jí),可執(zhí)行文件是否受影響”這個(gè)意義下討論,我稱之為 library (主要是 shared library,即動(dòng)態(tài)鏈接庫(kù))的 ABI (application binary interface)。至于編譯器與操作系統(tǒng)的 ABI 留給下一篇談 C++ 標(biāo)準(zhǔn)與實(shí)踐的文章。

            什么是二進(jìn)制兼容性

            在解釋這個(gè)定義之前,先看看 Unix/C 語(yǔ)言的一個(gè)歷史問(wèn)題:open() 的 flags 參數(shù)的取值。open(2) 函數(shù)的原型是

            int open(const char *pathname, int flags);

            其中 flags 的取值有三個(gè): O_RDONLY,  O_WRONLY,  O_RDWR。

            與一般人的直覺(jué)相反,這幾個(gè)值不是按位或 (bitwise-OR) 的關(guān)系,即 O_RDONLY | O_WRONLY != O_RDWR。如果你想以讀寫方式打開文件,必須用 O_RDWR,而不能用 (O_RDONLY | O_WRONLY)。為什么?因?yàn)?O_RDONLY, O_WRONLY, O_RDWR 的值分別是 0, 1, 2。它們不滿足按位或。

            那么為什么 C 語(yǔ)言從誕生到現(xiàn)在一直沒(méi)有糾正這個(gè)不足之處?比方說(shuō)把 O_RDONLY, O_WRONLY, O_RDWR 分別定義為 1, 2, 3,這樣 O_RDONLY | O_WRONLY == O_RDWR,符合直覺(jué)。而且這三個(gè)值都是宏定義,也不需要修改現(xiàn)有的源代碼,只需要改改系統(tǒng)的頭文件就行了。

            因?yàn)檫@么做會(huì)破壞二進(jìn)制兼容性。對(duì)于已經(jīng)編譯好的可執(zhí)行文件,它調(diào)用 open(2) 的參數(shù)是寫死的,更改頭文件并不能影響已經(jīng)編譯好的可執(zhí)行文件。比方說(shuō)這個(gè)可執(zhí)行文件會(huì)調(diào)用 open(path, 1) 來(lái)文件,而在新規(guī)定中,這表示文件,程序就錯(cuò)亂了。

            以上這個(gè)例子說(shuō)明,如果以 shared library 方式提供函數(shù)庫(kù),那么頭文件和庫(kù)文件不能輕易修改,否則容易破壞已有的二進(jìn)制可執(zhí)行文件,或者其他用到這個(gè) shared library 的 library。操作系統(tǒng)的 system call 可以看成 Kernel 與 User space 的 interface,kernel 在這個(gè)意義下也可以當(dāng)成 shared library,你可以把內(nèi)核從 2.6.30 升級(jí)到 2.6.35,而不需要重新編譯所有用戶態(tài)的程序。

            所謂“二進(jìn)制兼容性”指的就是在升級(jí)(也可能是 bug fix)庫(kù)文件的時(shí)候,不必重新編譯使用這個(gè)庫(kù)的可執(zhí)行文件或使用這個(gè)庫(kù)的其他庫(kù)文件,程序的功能不被破壞。

            見(jiàn) QT FAQ 的有關(guān)條款:http://developer.qt.nokia.com/faq/answer/you_frequently_say_that_you_cannot_add_this_or_that_feature_because_it_woul

            在 Windows 下有惡名叫 DLL Hell,比如 MFC 有一堆 DLL,mfc40.dll, mfc42.dll, mfc71.dll, mfc80.dll, mfc90.dll,這是動(dòng)態(tài)鏈接庫(kù)的本質(zhì)問(wèn)題,怪不到 MFC 頭上。

            有哪些情況會(huì)破壞庫(kù)的 ABI

            到底如何判斷一個(gè)改動(dòng)是不是二進(jìn)制兼容呢?這跟 C++ 的實(shí)現(xiàn)方式直接相關(guān),雖然 C++ 標(biāo)準(zhǔn)沒(méi)有規(guī)定 C++ 的 ABI,但是幾乎所有主流平臺(tái)都有明文或事實(shí)上的 ABI 標(biāo)準(zhǔn)。比方說(shuō) ARM 有 EABI,Intel Itanium 有 http://www.codesourcery.com/public/cxx-abi/abi.html,x86-64 有仿 Itanium 的 ABI,SPARC 和 MIPS 也都有明文規(guī)定的 ABI,等等。x86 是個(gè)例外,它只有事實(shí)上的 ABI,比如 Windows 就是 Visual C++,Linux 是 G++(G++ 的 ABI 還有多個(gè)版本,目前最新的是 G++ 3.4 的版本),Intel 的 C++ 編譯器也得按照 Visual C++ 或 G++ 的 ABI 來(lái)生成代碼,否則就不能與系統(tǒng)其它部件兼容。

            C++ ABI 的主要內(nèi)容:

            • 函數(shù)參數(shù)傳遞的方式,比如 x86-64 用寄存器來(lái)傳函數(shù)的前 4 個(gè)整數(shù)參數(shù)
            • 虛函數(shù)的調(diào)用方式,通常是 vptr/vtbl 然后用 vtbl[offset] 來(lái)調(diào)用
            • struct 和 class 的內(nèi)存布局,通過(guò)偏移量來(lái)訪問(wèn)數(shù)據(jù)成員
            • name mangling
            • RTTI 和異常處理的實(shí)現(xiàn)(以下本文不考慮異常處理)

            C/C++ 通過(guò)頭文件暴露出動(dòng)態(tài)庫(kù)的使用方法,這個(gè)“使用方法”主要是給編譯器看的,編譯器會(huì)據(jù)此生成二進(jìn)制代碼,然后在運(yùn)行的時(shí)候通過(guò)裝載器(loader)把可執(zhí)行文件和動(dòng)態(tài)庫(kù)綁到一起。如何判斷一個(gè)改動(dòng)是不是二進(jìn)制兼容,主要就是看頭文件暴露的這份“使用說(shuō)明”能否與新版本的動(dòng)態(tài)庫(kù)的實(shí)際使用方法兼容。因?yàn)樾碌膸?kù)必然有新的頭文件,但是現(xiàn)有的二進(jìn)制可執(zhí)行文件還是按舊的頭文件來(lái)調(diào)用動(dòng)態(tài)庫(kù)。

            這里舉一些源代碼兼容但是二進(jìn)制代碼不兼容例子

            • 給函數(shù)增加默認(rèn)參數(shù),現(xiàn)有的可執(zhí)行文件無(wú)法傳這個(gè)額外的參數(shù)。
            • 增加虛函數(shù),會(huì)造成 vtbl 里的排列變化。(不要考慮“只在末尾增加”這種取巧行為,因?yàn)槟愕?class 可能已被繼承。)
            • 增加默認(rèn)模板類型參數(shù),比方說(shuō) Foo<T> 改為 Foo<T, Alloc=alloc<T> >,這會(huì)改變 name mangling
            • 改變 enum 的值,把 enum Color { Red = 3 }; 改為 Red = 4。這會(huì)造成錯(cuò)位。當(dāng)然,由于 enum 自動(dòng)排列取值,添加 enum 項(xiàng)也是不安全的,除非是在末尾添加。

            給 class Bar 增加數(shù)據(jù)成員,造成 sizeof(Bar) 變大,以及內(nèi)部數(shù)據(jù)成員的 offset 變化,這是不是安全的?通常不是安全的,但也有例外。

            • 如果客戶代碼里有 new Bar,那么肯定不安全,因?yàn)?new 的字節(jié)數(shù)不夠裝下新 Bar。相反,如果 library 通過(guò) factory 返回 Bar* (并通過(guò) factory 來(lái)銷毀對(duì)象)或者直接返回 shared_ptr<Bar>,客戶端不需要用到 sizeof(Bar),那么可能是安全的。
            • 如果客戶代碼里有 Bar* pBar; pBar->memberA = xx;,那么肯定不安全,因?yàn)?memberA 的新 Bar 的偏移可能會(huì)變。相反,如果只通過(guò)成員函數(shù)來(lái)訪問(wèn)對(duì)象的數(shù)據(jù)成員,客戶端不需要用到 data member 的 offsets,那么可能是安全的。
            • 如果客戶調(diào)用 pBar->setMemberA(xx); 而 Bar::setMemberA() 是個(gè) inline function,那么肯定不安全,因?yàn)槠屏恳呀?jīng)被 inline 到客戶的二進(jìn)制代碼里了。如果 setMemberA() 是 outline function,其實(shí)現(xiàn)位于 shared library 中,會(huì)隨著 Bar 的更新而更新,那么可能是安全的。

            那么只使用 header-only 的庫(kù)文件是不是安全呢?不一定。如果你的程序用了 boost 1.36.0,而你依賴的某個(gè) library 在編譯的時(shí)候用的是 1.33.1,那么你的程序和這個(gè) library 就不能正常工作。因?yàn)?1.36.0 和 1.33.1 的 boost::function 的模板參數(shù)類型的個(gè)數(shù)不一樣,其中一個(gè)多了 allocator。

            這里有一份黑名單,列在這里的肯定是二級(jí)制不兼容,沒(méi)有列出的也可能二進(jìn)制不兼容,見(jiàn) KDE 的文檔:http://techbase.kde.org/Policies/Binary_Compatibility_Issues_With_C%2B%2B

             

            哪些做法多半是安全的

            前面我說(shuō)“不能輕易修改”,暗示有些改動(dòng)多半是安全的,這里有一份白名單,歡迎添加更多內(nèi)容。

            只要庫(kù)改動(dòng)不影響現(xiàn)有的可執(zhí)行文件的二進(jìn)制代碼的正確性,那么就是安全的,我們可以先部署新的庫(kù),讓現(xiàn)有的二進(jìn)制程序受益。

            • 增加新的 class
            • 增加 non-virtual 成員函數(shù)
            • 修改數(shù)據(jù)成員的名稱,因?yàn)樯a(chǎn)的二進(jìn)制代碼是按偏移量來(lái)訪問(wèn)的,當(dāng)然,這會(huì)造成源碼級(jí)的不兼容。
            • 還有很多,不一一列舉了。

            歡迎補(bǔ)充

            反面教材:COM

            在 C++ 中以虛函數(shù)作為接口基本上就跟二進(jìn)制兼容性說(shuō)拜拜了。具體地說(shuō),以只包含虛函數(shù)的 class (稱為 interface class)作為程序庫(kù)的接口,這樣的接口是僵硬的,一旦發(fā)布,無(wú)法修改。

            比方說(shuō) M$ 的 COM,其 DirectX 和 MSXML 都以 COM 組件方式發(fā)布,我們來(lái)看看它的帶版本接口 (versioned interfaces):

            • IDirect3D7, IDirect3D8, IDirect3D9, ID3D10*, ID3D11*
            • IXMLDOMDocument, IXMLDOMDocument2, IXMLDOMDocument3

            換話句話說(shuō),每次發(fā)布新版本都引入新的 interface class,而不是在現(xiàn)有的 interface 上做擴(kuò)充。這樣一樣不能兼容現(xiàn)有的代碼,強(qiáng)迫客戶端代碼也要改寫。

            回過(guò)頭來(lái)看看 C 語(yǔ)言,C/Posix 這些年逐漸加入了很多新函數(shù),同時(shí),現(xiàn)有的代碼不用修改也能運(yùn)行得很好。如果要用這些新函數(shù),直接用就行了,也基本不會(huì)修改已有的代碼。相反,COM 里邊要想用 IXMLDOMDocument3 的功能,就得把現(xiàn)有的代碼從 IXMLDOMDocument 全部升級(jí)到 IXMLDOMDocument3,很諷刺吧。

            tip:如果遇到鼓吹在 C++ 里使用面向接口編程的人,可以拿二進(jìn)制兼容性考考他。

            解決辦法

            采用靜態(tài)鏈接

            這個(gè)是王道。在分布式系統(tǒng)這,采用靜態(tài)鏈接也帶來(lái)部署上的好處,只要把可執(zhí)行文件放到機(jī)器上就行運(yùn)行,不用考慮它依賴的 libraries。目前 muduo 就是采用靜態(tài)鏈接。

            通過(guò)動(dòng)態(tài)庫(kù)的版本管理來(lái)控制兼容性

            這需要非常小心檢查每次改動(dòng)的二進(jìn)制兼容性并做好發(fā)布計(jì)劃,比如 1.0.x 系列做到二進(jìn)制兼容,1.1.x 系列做到二進(jìn)制兼容,而 1.0.x 和 1.1.x 二進(jìn)制不兼容?!冻绦騿T的自我修養(yǎng)》里邊講過(guò) .so 文件的命名與二進(jìn)制兼容性相關(guān)的話題,值得一讀。 

            用 pimpl 技法,編譯器防火墻

            在頭文件中只暴露 non-virtual 接口,并且 class 的大小固定為 sizeof(Impl*),這樣可以隨意更新庫(kù)文件而不影響可執(zhí)行文件。當(dāng)然,這么做有多了一道間接性,可能有一定的性能損失。見(jiàn) Exceptional C++ 有關(guān)條款和 C++ Coding Standards 101.

            Java 是如何應(yīng)對(duì)的

            Java 實(shí)際上把 C/C++ 的 linking 這一步驟推遲到 class loading 的時(shí)候來(lái)做。就不存在“不能增加虛函數(shù)”,“不能修改 data member” 等問(wèn)題。在 Java 里邊用面向 interface 編程遠(yuǎn)比 C++ 更通用和自然,也沒(méi)有上面提到的“僵硬的接口”問(wèn)題。

            (待續(xù))

            posted on 2011-03-09 10:48 陳碩 閱讀(13208) 評(píng)論(6)  編輯 收藏 引用

            評(píng)論

            # re: C++ 工程實(shí)踐(4):二進(jìn)制兼容性 2011-03-09 15:02 素素

            第一個(gè)例子主要原因還是因?yàn)楹芏嗳嗽趯懙臅r(shí)候根本不用常量宏,而直接用常數(shù)0,1,2代表標(biāo)準(zhǔn)輸入|輸出|錯(cuò)誤吧,這樣代碼級(jí)也不兼容了。  回復(fù)  更多評(píng)論   

            # re: C++ 工程實(shí)踐(4):二進(jìn)制兼容性 2011-03-09 17:43 vczh

            那還不是因?yàn)樯?jí)的時(shí)候不想更新所有dll嗎。如果你的源代碼都是同一個(gè)編譯器出來(lái),而且升級(jí)不會(huì)試圖偷懶,那有什么所謂呢。

            不過(guò)qq什么的就除外了,最好dll做成extern"C",可以少掉很多問(wèn)題,因?yàn)楹芏鄁eature在h里面不能出現(xiàn)了,強(qiáng)迫自己包裝。  回復(fù)  更多評(píng)論   

            # re: C++ 工程實(shí)踐(4):二進(jìn)制兼容性[未登錄](méi) 2011-03-09 18:35 vincent

            @素素
            常量宏本質(zhì)上也只是0,1,2啊
            在已編譯的可執(zhí)行程序中就是0,1,2
            這個(gè)時(shí)候如果是動(dòng)態(tài)鏈接crt的dll,那自然有問(wèn)題啊,這就是ABI的二進(jìn)制不兼容


              回復(fù)  更多評(píng)論   

            # re: C++ 工程實(shí)踐(4):二進(jìn)制兼容性 2011-03-09 23:29 陳碩

            @vczh
            不是偷不偷懶的問(wèn)題。假設(shè)你是一個(gè) shared library 的維護(hù)者,你的 library 被另外兩三個(gè)團(tuán)隊(duì)使用了。你發(fā)現(xiàn)了一個(gè)安全漏洞,或者某個(gè)會(huì)導(dǎo)致 crash 的 bug 需要修復(fù),那么你修復(fù)之后,能不能直接部署 library 的二進(jìn)制文件?有沒(méi)有破壞二進(jìn)制兼容性?會(huì)不會(huì)破壞別人團(tuán)隊(duì)已經(jīng)編譯好的投入使用的可執(zhí)行文件?是不是要強(qiáng)迫別的團(tuán)隊(duì)重新編譯鏈接,把可執(zhí)行文件也發(fā)布新版本?會(huì)不會(huì)打亂別人的 release cycle?這些都是工程開發(fā)中應(yīng)該考慮的問(wèn)題。  回復(fù)  更多評(píng)論   

            # re: C++ 工程實(shí)踐(4):二進(jìn)制兼容性 2011-03-10 11:50 haohao06

            個(gè)人感覺(jué)com主要是為了跨語(yǔ)言的二進(jìn)制復(fù)用.  回復(fù)  更多評(píng)論   

            # re: C++ 工程實(shí)踐(4):二進(jìn)制兼容性 2011-03-10 22:21 qiuxiafei

            @陳碩
            確實(shí),比如兩個(gè)項(xiàng)目在并行開發(fā),不考慮二進(jìn)制兼容性往往除是經(jīng)常需要編譯依賴庫(kù)》。  回復(fù)  更多評(píng)論   

            <2013年10月>
            293012345
            6789101112
            13141516171819
            20212223242526
            272829303112
            3456789

            導(dǎo)航

            統(tǒng)計(jì)

            常用鏈接

            隨筆分類

            隨筆檔案

            相冊(cè)

            搜索

            最新評(píng)論

            閱讀排行榜

            評(píng)論排行榜

            国产L精品国产亚洲区久久| 精品久久久久久国产免费了| 国产AV影片久久久久久| 婷婷久久久亚洲欧洲日产国码AV| 久久亚洲天堂| 一本久久精品一区二区| 久久精品国产只有精品66 | 亚洲综合精品香蕉久久网97| 久久偷看各类wc女厕嘘嘘| 亚洲香蕉网久久综合影视| 亚洲午夜久久久影院| 欧美黑人又粗又大久久久| 热re99久久精品国99热| 97久久国产亚洲精品超碰热| 色偷偷久久一区二区三区| 久久久一本精品99久久精品88| 久久综合精品国产二区无码| 久久99精品国产一区二区三区| 久久精品国产精品青草app| 99久久国产综合精品五月天喷水| 久久99精品久久久久久秒播| 日本欧美国产精品第一页久久| 亚洲欧洲精品成人久久奇米网| 精品久久亚洲中文无码| 久久66热人妻偷产精品9| 精品久久久久久99人妻| 热久久最新网站获取| 久久国产乱子伦免费精品| 久久亚洲欧美日本精品| 久久男人AV资源网站| 国内精品久久久久久99| 国内精品久久久久久久coent| 亚洲欧洲精品成人久久奇米网| 久久久久人妻一区精品色| 精品综合久久久久久88小说| 久久久久波多野结衣高潮| 久久96国产精品久久久| 一本色综合久久| 18岁日韩内射颜射午夜久久成人 | 伊人久久大香线蕉综合热线| 久久久无码人妻精品无码|