国产乱码精品1区2区3区,久久精品国产免费,国产精品一二

2018年5月26日

string類的設(shè)計(jì)

String類的設(shè)計(jì)一點(diǎn)都不容易，先不論C++，那怕是其他語言，在面對(duì)string的時(shí)候，一不小心也會(huì)掉坑，好比java，好比C#，一開始假設(shè)utf16是定長(zhǎng)編碼，后來Unicode發(fā)展到兩個(gè)字節(jié)就裝不下一個(gè)碼位，字符串在java下，就有點(diǎn)尷尬了。就算是昧著良心用utf32編碼，碼元與碼位終于一一對(duì)應(yīng)了，也會(huì)遇到物理字符與邏輯字符不對(duì)應(yīng)的時(shí)候，好像有些語言的字符要用兩個(gè)unicode值來表示（很奇怪），有些語言的一個(gè)小寫字符對(duì)應(yīng)著好幾個(gè)大寫字符。即便是字符串選定了一種編碼方式，始終還是要解決與其他編碼的交互問題，這些交互接口也不容易設(shè)計(jì)。另外，每次從長(zhǎng)字符串中截取字符串都要重新new出來一條新的字符串，難免有一點(diǎn)點(diǎn)浪費(fèi)，當(dāng)然，現(xiàn)在計(jì)算機(jī)性能過剩，這純粹是強(qiáng)迫癥。

而到了c++下，設(shè)計(jì)字符串所遇到的問題，就遠(yuǎn)比想象中復(fù)雜，無中生有的又憑空多出來很多不必要的要求，內(nèi)存資源管理（這個(gè)在C++幾乎是無解），異常安全（往字符串添加新內(nèi)容，假如內(nèi)存分配失敗，必須保持原有值的完整性），還有性能要求（截取字符串避免生成新的字符串）。很多很多的要求，導(dǎo)致語言層面上壓根就沒法也不可能提供原生的字符串支持，而這一點(diǎn)上又引出來新的問題，代碼里面，邏輯意義上看，就不止存在一種字符串類型。好在，大C++擁有豐富多彩的feature，應(yīng)該足以實(shí)現(xiàn)字符串類型了，這也是大C++的設(shè)計(jì)哲學(xué)，既然語言上沒法實(shí)現(xiàn)的東西，就提供用以支持這種東西的feature，用戶要怎么實(shí)現(xiàn)就怎么實(shí)現(xiàn)，選擇權(quán)交到用戶手里。

所以，C++的庫要怎么做出來一道string，這道菜的味道如何，就很讓人好奇。一路考察下來，讓人大跌眼鏡，竟然沒有一個(gè)c++庫能提供品質(zhì)優(yōu)良字符串，其抽象充其量也就是比字符數(shù)組好一點(diǎn)點(diǎn)，完全就沒有Unicode編碼的抽象。Stl的字符串更讓人發(fā)指，竟然有幾個(gè)模板參數(shù)，本來多類型的字符串問題就更是雪上加霜了，另外stl的string還不能作為dll函數(shù)的參數(shù)類型。其實(shí)，很多時(shí)候，猿猴的要求真的不高，只要求一種utf8編碼的string，帶有格式化，還有一些split，trim，FindOneOf，toupper等常用字符串處理的操作就行了，只可惜，沒有一個(gè)c++庫能基本滿足這樣的基本要求。其實(shí)，這些要求，具體到C++下，要基本滿足，也的確很困難。

除了c++，很多語言的string類型都是原子屬性，一個(gè)string值，但凡一點(diǎn)風(fēng)吹草動(dòng)，都要生成新的string值，原有的值必須保持不變。此外，其官方也提供了類似于StringBuffer或者StringBuilder用以構(gòu)造很長(zhǎng)很長(zhǎng)，以彌補(bǔ)這種動(dòng)不動(dòng)就生成新String的性能問題。這兩種類型涇渭分明。而c++的string，似乎是把這兩種類型糅合在一塊了，由此帶來語義上的不清晰，也造成很多不必要的麻煩，因?yàn)榻^大多數(shù)場(chǎng)合下，只需要使用string的原子屬性，可變的string只是用來保存字符緩沖而已。知道嗎，stl的string有一百多個(gè)成員函數(shù)，很多都是不必要的重載，不過是為了避免字符串的復(fù)制而已。

所以，首先要對(duì)只讀的string做抽象，也即是string_view，只需兩個(gè)成員字段，字符串的起始地址以及緩沖長(zhǎng)度，并且不要求以0結(jié)束，它有一個(gè)很好的特性，字符串的任何一部分，也都是字符串，甚至，必要時(shí)，一個(gè)字符，通過取地址，也可以看做是長(zhǎng)度為1的string_view。任何連續(xù)的內(nèi)存字符塊，都可以看做是string_view。其不必涉及內(nèi)存的分配，顯得非常的輕量級(jí)，可以在程序中到處使用，只需注意到字符緩沖的生命周期，就不必?fù)?dān)心會(huì)引來什么問題。在string_view上，可以做trim，比較，查找，反向查找等操作，除了讀取單個(gè)字節(jié)的迭代器，還提供兩套迭代器，用以取到unicode碼位值（uin32），和用以訪問邏輯字符，其值也為stirng_view。

剩下來就是可寫可修改的string，要求以0結(jié)束，也即是stl的string，因?yàn)楹芏嗪瘮?shù)都在string_view上，所以這里基本上都只是插入、添加、刪除、替換的操作，要注意的是，中括號(hào)操作符不能返回字符引用，因?yàn)槟菢油耆珱]有任何意義，就算是保留中括號(hào)返回字符值，意義也很小。Trim、查找、比較等操作，必須通過其成員函數(shù)view來返回代表自己的string_view。String的很多成員函數(shù)，大多數(shù)參數(shù)類型就是string_view，因此也沒有像是在stl下垃圾string的那么多亂七八糟的重載。很簡(jiǎn)明的設(shè)計(jì)，性能與簡(jiǎn)單的良好統(tǒng)一，不知為何，stl要到c++17的時(shí)候，才會(huì)加入stirng_view這么重要的類型，即便是如此，stl的string既有代碼已成定局，也沒辦法用string_view來簡(jiǎn)化它的一百多個(gè)的成員函數(shù)了

posted @ 2018-05-26 11:51 華夏之火閱讀(1420) | 評(píng)論 (0) | 編輯收藏

2018年5月22日

U8String的重構(gòu)體會(huì)

近兩年來在寫C++的運(yùn)行時(shí)環(huán)境，反射、運(yùn)行時(shí)類型信息、內(nèi)存管理、并行、字符串、協(xié)程、ORM等等，基本上重寫了一套標(biāo)準(zhǔn)庫以及運(yùn)行庫。對(duì)于在c++下使用字符串，深有體會(huì)。一開始嘔心瀝血，殫精竭慮，支持多種編碼方式（Utf8、Utf7、GB2312、Utf16LE，Utf16BE等）的字符串類型，以及在此之上的對(duì)這些字符串提供格式化、字符串解析、json、xml、文件讀寫BOM等等功能，必須承認(rèn)，大C++真是變態(tài)，像是這樣變態(tài)無聊的概念都可以支持，還可以實(shí)現(xiàn)得很好，用起來確實(shí)也方便。可是，每次面臨字符串操作的時(shí)候，都會(huì)心里發(fā)毛，都會(huì)嘀咕此時(shí)此刻，糾結(jié)的是哪門子的編碼，也搞得很多代碼必須以template的形式，放在頭文件上，不放在頭文件，就必須抽象出來一個(gè)通用的動(dòng)態(tài)字符串類型，代表任意編碼的一種字符串類型，代碼里面引入各種各樣臆造的復(fù)雜性。終于受不了啦，最后搞成統(tǒng)一用utf8編碼，重構(gòu)了幾千行代碼（十幾個(gè)文件），然后，整個(gè)字符串世界終于清靜了，接口api設(shè)計(jì)什么的，也一下子清爽了很多。整個(gè)程序內(nèi)部，就應(yīng)該只使用同一種編碼的字符串。stl的帶有多個(gè)模板的string設(shè)計(jì)，就是無病呻吟，畫蛇添足。

為什么選擇Utf8編碼，首先，非unicode編碼的字符串是不能考慮的；其次，utf16也是變長(zhǎng)的編碼方式，而且還有大小端的區(qū)別，所以也不能考慮；utf32又太占用內(nèi)存了。想來想去，終于下定決心，utf8簡(jiǎn)直就是唯一的選擇了。雖然可能有這樣那樣的小問題，比如說，純中文文本，utf8占用多50%內(nèi)存（相比于Utf16），windows下utf8有點(diǎn)不友好。但其實(shí)都不是問題，也都可以解決。比如說，windows下，所有的涉及字符串與系統(tǒng)的api交互，先臨時(shí)轉(zhuǎn)換成utf16，然后再調(diào)用api。api的返回結(jié)果為utf16，再轉(zhuǎn)換為utf8。好像有一點(diǎn)性能上的損失，其實(shí)沒啥大不了的。windows對(duì)于多字節(jié)也是這樣支持的，完全就感受不到性能上的影響。總之，utf8簡(jiǎn)直就是程序處理的唯一字符串編碼。

吐槽一下std的字符串，以及與此相關(guān)的一切概念，iostream，locale等等東西，垃圾設(shè)計(jì)的典范。接口不友好，功能弱，而且還性能差，更關(guān)鍵的是其抽象上的泄漏。一整天就只會(huì)在引用計(jì)數(shù)，寫時(shí)復(fù)制，短字符串優(yōu)化上做文章，時(shí)間精力都不用在刀刃上。C++17終于引入string_view的類型，情況稍微有些改善。由于字符串使用上不方便，也因此損失了一大片的用戶，陣地一再失守。整體上講，stl的設(shè)計(jì)，自然是有精心的考慮，但是，作出這些抽象的標(biāo)準(zhǔn)會(huì)上一大群的老爺子們，大概率上講，應(yīng)該是沒有用stl正兒八經(jīng)地開發(fā)工業(yè)級(jí)上的代碼，臆造抽象，顧慮太多，表面上看起來好像是那么一回事，真正用起來的時(shí)候，就不太對(duì)勁，會(huì)有這樣那樣的不足，很不方便。

簡(jiǎn)單說一下U8String的設(shè)計(jì)思路。U8String用以管理字符串編碼緩存的生命周期，追加縮短替換字符串，支持通過下標(biāo)可以讀取字節(jié)char，但是不支持將字節(jié)寫入到某個(gè)索引上的位置，當(dāng)然支持往字符串中插入unicode編碼的字符。至于字符串的比較、查找、Trim、截取子字符串這些常用操作，就全部壓在U8View上。如果U8String要使用這些，要先通過view的函數(shù)，獲取自己字節(jié)緩存下的視圖。U8View表示一段連續(xù)的字符編碼內(nèi)存，U8View的任意一部分也是U8View，不要求以0結(jié)束。只要求U8View的生存周期不能比其宿主（U8String，字符數(shù)組，U8原生字符串）長(zhǎng)命。事實(shí)上，很多api的字符串參數(shù)，其實(shí)只是要求為U8View就行了，不需要是什么const string&類型。此外，還提供U8PointPtr的指針類型，用以遍歷U8View，其取值為unicode編碼值，也就是wchar_t類型。另外，既然有U8View，自然也就有ArrayView，代表連續(xù)內(nèi)存塊的任意類型。

自然，庫中必須提供格式化Fmt以及解析字符串Scanf的函數(shù)。StrFmt用以生成新的U8String，而Fmt格式化函數(shù)中傳入字符串的話，就將格式化結(jié)果追加到字符串后面。Fmt可以格式化數(shù)據(jù)到控制臺(tái)，文本文件，日志等等輸出結(jié)果上。StrFmt的實(shí)現(xiàn)只是簡(jiǎn)單地調(diào)用Fmt并返回U8String。有了Fmt和Scanf，操作字符串就很方便很靈活了，同時(shí)也消除很多很多有關(guān)字符串相關(guān)的處理函數(shù)。Fmt不僅僅能格式化基本類型，自定義類型，還能格式化數(shù)組，vector，list，pair，tuple等模板類型的數(shù)據(jù)。庫中也提供了類似于iostream重載<<和>>的操作符。大C++提高的feature，造出來的string類型，使用上的方便，一點(diǎn)都不遜色于其他任何語言的原生string類型。當(dāng)然，std的那個(gè)string，簡(jiǎn)直就是廢物。

不管怎么說，本人還是很喜歡C++的，用c++寫代碼很舒暢，可比用C#、haskell、lisp、scala時(shí)要開心很多。C++發(fā)展到C++11，基本功能也都完備了，當(dāng)然，C++14、C++17自然功能更加強(qiáng)大，特別是實(shí)現(xiàn)模板庫的時(shí)候，就更方便了，也確實(shí)很吸引人。自然，C++也非十全十美，也有很多的不足，比如不能自定義操作符，不提供非侵入式的成員函數(shù)，缺乏延遲求值的語言機(jī)制，引用的修改綁定（只要不綁定到nullptr就好了），成員函數(shù)指針的無端限制。但是，世界上又哪里存在完美的language呢，特別是對(duì)于這種直接操縱內(nèi)存的底層語言來說。至于rust，叫囂著要取代c++，就它那副特性，還遠(yuǎn)著呢。

posted @ 2018-05-22 17:10 華夏之火閱讀(1926) | 評(píng)論 (0) | 編輯收藏

2017年12月13日

私有繼承小討論

大家都知道，大C++里面可以私有繼承，之后基類的一切，在子類中就成為private的了，不對(duì)外開放了。現(xiàn)在流行接口，組合優(yōu)化繼承，所以private繼承這玩意，日漸式微，很久以前就很少使用了，嗯，不要說private，就算是大c++，也是江河日下。不過，存在即合理，c++語法里面的任何東西，都有其價(jià)值，平時(shí)可以用不到，但是關(guān)鍵時(shí)刻用一下，確實(shí)很方便，當(dāng)然多數(shù)情況下，也可以其他途徑來完成，但是，就是沒那么舒服。

廢話就不說了，直入正題吧。

假設(shè)，現(xiàn)在有接口，假設(shè)是IUnknown，里面有那三個(gè)著名的純虛函數(shù)，QueryInterface, AddRef, Release，好像是這三個(gè)哥倆。

然后，有一個(gè)類，就叫ClassA，實(shí)現(xiàn)了IUnknown接口，其實(shí)就是繼承IUnknown，也就是說，重寫了那三個(gè)純虛函數(shù)。此外，ClassA還有一大堆自己的東西，比如public的字段或者成員函數(shù)。

現(xiàn)在，有ClassB，想基于ClassA來做一些事情，但是又不想讓用戶看到ClassA里面那些亂七八糟的玩意，因此，這種情況下，用private似乎很合適。代碼如下：

struct IUnknown

{

public:

virtual HRESULT QueryInterface(REFIID riid,void** ppvObject) = 0;

virtual ULONG AddRef() = 0;

virtual ULONG Release() = 0;

};

struct ClassA : IUnknown

{

virtual HRESULT QueryInterface(REFIID riid, void** ppvObject) override { ... }

virtual ULONG AddRef() override { ... }

virtual ULONG Release() override { ... }

...

};

struct ClassB : private ClassA

{

...

};

這里，內(nèi)存的使用上非常緊湊，可以說，沒有多余的地方。但是，這里的private，不僅僅會(huì)private ClassA的一切，就連IUnknown也被private，這有時(shí)候就不符合要求了，因?yàn)檫@里意圖是，private ClassA，但是又想public IUnknown，也就是說，對(duì)外界來說，ClassB不是ClassA，雖然其內(nèi)部基于ClassA實(shí)現(xiàn)，但是，又希望ClassB是IUnknown。對(duì)此，有幾種解決做法，但是都不能讓人滿意。

方法1、讓ClassB再次實(shí)現(xiàn)IUnknown接口，如下所示：

struct ClassB : private ClassA, public IUnknown

{

virtual HRESULT QueryInterface(REFIID riid, void** ppvObject) override { ... }

virtual ULONG AddRef() override { ... }

virtual ULONG Release() override { ... }

};

其好處是，ClassB的實(shí)例可以無縫用于IUnknown的一切場(chǎng)合，不管是引用或者指針，const非const。但是，代價(jià)也是很大的，首先要針對(duì)IUnknown的每個(gè)虛函數(shù)，都要一一手寫，再次轉(zhuǎn)發(fā)給private的基類，其次，ClassB比ClassA多了一個(gè)虛函數(shù)表指針，大小就比原來多了一個(gè)指針的大小，這就不是零懲罰了，這是最不該。

方法2，還是保持私有繼承，再在ClassB中添加幾個(gè)函數(shù)，用以返回IUnknown，代碼如下

struct ClassB : private ClassA

{

//也可以using ClassA的三個(gè)IUnknown里面的函數(shù)

const IUnknown* GetUnknown()const { return this; }

IUnknown* GetUnknown()const { return this; }

};

避開了方法1的不足，但是就不能無縫用于IUnknown下，每次使用必須調(diào)用一下GetUnknown()，對(duì)于引用的情況下，還必須加多一個(gè)星號(hào)*，也是挺不方便的。對(duì)了，這里就算添加了類型函數(shù)重載，也即是operator IUnknown，編譯器也拒絕將ClassB無縫轉(zhuǎn)換成IUnknown。

方法3，用包含，不用私有繼承。如下：

struct ClassB

{

ClassA mA;

operator const IUnknown&()const { return *this; }

operator IUnknown&() { return *this; }

};

這樣子，ClassB的實(shí)例可以無縫用于IUnknown引用下的情況。對(duì)于指針的話，可以仿造方法2那樣子，寫兩個(gè)函數(shù)進(jìn)行調(diào)用。貌似綜合起來，方法3的整體分?jǐn)?shù)最高。

就個(gè)人而言，更偏向于，直接就讓ClassB public繼承ClassA好了，少了那么多鬼怪，雖然出現(xiàn)很多不必要的函數(shù)，其實(shí)也沒什么不好。

posted @ 2017-12-13 15:17 華夏之火閱讀(1241) | 評(píng)論 (2) | 編輯收藏

2017年7月15日

回顧C(jī)++

本人對(duì)于c++的認(rèn)識(shí)，多年下來，經(jīng)歷了以下幾個(gè)階段，

1、 c++很好很強(qiáng)大，盲目追求運(yùn)行性能，簡(jiǎn)直巴普洛夫條件反射，貢獻(xiàn)了一大坨垃圾代碼；

2、 c++的面向?qū)ο髮?duì)持很垃圾，什么鬼，代碼很容易就耦合，于是迷上對(duì)象+消息發(fā)送的面向?qū)ο螅?/span>

3、 c++太復(fù)雜了，template太抽象，天外飛仙，搞不懂，二進(jìn)制復(fù)用又差。整個(gè)c++就是垃圾，簡(jiǎn)直程序設(shè)計(jì)語言里面的敗類，C語言多好啊，小巧精致簡(jiǎn)單清晰；

4、使用其他語言做開發(fā)，java、C#、F#、elisp、scheme、python、haskell、javascript、php等等一大坨語言，感概每一種語言都比垃圾C++不要好太多，發(fā)誓不再用c++寫哪怕一行的代碼；

5、某一天，突然有點(diǎn)理解了這種語言，一切變得清晰了，原來c++也相當(dāng)不錯(cuò)，也可以做一些事情，看開之后，感覺開發(fā)效率也跟上來了，做同樣的事情，用c++實(shí)現(xiàn)不會(huì)比C#、python等慢。

相比于其他語言，c++的獨(dú)特優(yōu)勢(shì)在于

預(yù)編譯期的偽圖靈完備，這一點(diǎn)，好多語言還是有的，并且更超級(jí)好，比如rust，scheme

編譯期間的C++是功能完備的解釋器，其輸出結(jié)果是正常運(yùn)行的c++代碼，結(jié)合宏，可以制造很多其他語言必須在語法層面上支持的語法糖。這個(gè)解釋器的奇妙之處在于它運(yùn)行于編譯期，一旦錯(cuò)誤的模板代碼要進(jìn)入運(yùn)行期，就會(huì)出現(xiàn)編譯錯(cuò)誤，而不需要進(jìn)入運(yùn)行時(shí)的代碼，即便天大錯(cuò)誤，也都不要緊，而一旦這段代碼要進(jìn)入運(yùn)行時(shí)，那么模板錯(cuò)誤就逃不過編譯期解釋器的法眼。

生成各種內(nèi)存布局的便利語法糖和自由的內(nèi)存操控；不同類型的對(duì)象，只要其內(nèi)存布局一致，通過強(qiáng)制轉(zhuǎn)換，就可按同一類型來處理，這一點(diǎn)作死能力，絕不被有gc的語言支持。內(nèi)存的無節(jié)操玩弄，結(jié)合template，分分鐘就能仿真出來其他必須語言層面上提供的數(shù)據(jù)結(jié)構(gòu)，類型安全、運(yùn)行性能、易用性，一點(diǎn)都不遜色，好比string，委托，元組，列表，可空類型；

C++的專有特性，raii、多繼承和全局變量。特別是全局變量，結(jié)合它的構(gòu)造函數(shù)特點(diǎn)和類型推導(dǎo)，所能玩出來的豐富新花樣，其他語言很難做到。全局變量是連接運(yùn)行期和編譯期的橋梁。如果沒有全局變量，本座應(yīng)該不會(huì)再次對(duì)c++產(chǎn)生熱情。奇怪的是，至今為止，c++的基礎(chǔ)庫都不怎么挖掘全局變量的潛能。當(dāng)然，對(duì)全局變量的使用，肯定是把它當(dāng)做常量來用，全局變量有唯一的內(nèi)存地址，就起到原子的作用，但它又可打包了豐富的靜態(tài)類型信息。

以上的獨(dú)特，造就了c++層出不窮的新意，而卓越的運(yùn)行性能，只是其微不足道的優(yōu)點(diǎn)。雖然說，語言不重要，思想才重要，軟件架構(gòu)才重要，但是c++所能承載的思想，以及其到達(dá)的抽象高度，的確就真的大大降低框架的復(fù)雜性，誠然，c++的基礎(chǔ)庫開發(fā)要面臨無窮無盡的細(xì)節(jié)糾結(jié)，其實(shí)，這也反映了c++編譯器掌控細(xì)節(jié)的能力，因此，我們又可以讓編譯器自動(dòng)完成很多很多細(xì)節(jié)重復(fù)，從而大幅度地減輕代碼數(shù)量，還無損其運(yùn)行性能。又由于c++完備強(qiáng)大的靜態(tài)類型特性，在用動(dòng)態(tài)語言風(fēng)格的簡(jiǎn)潔來編寫代碼的同時(shí)，又無損其快速方便地代碼重構(gòu)。筆者的基礎(chǔ)庫項(xiàng)目，幾十次大規(guī)模的重構(gòu)，借助單元測(cè)試，保證了重構(gòu)順利快速的完成，深感c++在重構(gòu)上的便利，這些代碼，包括不到1千行卻功能完整的xml庫（還支持對(duì)象與xml數(shù)據(jù)的直接互相轉(zhuǎn)換）；不到1千行卻一點(diǎn)都不遜色于boost的spirit組合子解釋器（編譯速度卻快了很多，語法上簡(jiǎn)潔很多，更能方便地解釋各種語法）；才1千多行的異步io框架；輸入輸出，文件操作，數(shù)據(jù)庫，協(xié)程等代碼都簡(jiǎn)潔異常，所有這些代碼都支持動(dòng)態(tài)庫上的二進(jìn)制復(fù)用，讓人很驚詫于c++的光怪陸離的強(qiáng)大。

當(dāng)然，c++的缺陷也震撼人心，

1、語言特性太過繁雜抽象微妙，比如template、多繼承、運(yùn)算符重載、類型轉(zhuǎn)換、兼容性考慮的很多糟糕語言特性，所以對(duì)使用者的節(jié)制力要求很高，要求他們時(shí)刻清楚自己在干什么，瑣碎上的思考太多；

2、缺乏統(tǒng)一的二進(jìn)制標(biāo)準(zhǔn)，基礎(chǔ)庫都用源代碼的形式共享，這讓原本就龜速的編譯速度更加地令人大大感動(dòng)；

3、缺乏高標(biāo)準(zhǔn)的基礎(chǔ)庫，stl和boost更在某些技術(shù)運(yùn)用的展示上更起到很壞的影響；

4、缺乏某些延遲求值的機(jī)制，缺乏必要的函數(shù)式語言機(jī)制，所以c++始終就無法成為堂堂正正的現(xiàn)代化高級(jí)語言！

就這樣吧。

posted @ 2017-07-15 20:07 華夏之火閱讀(1867) | 評(píng)論 (2) | 編輯收藏

C++的非侵入式接口

終于寫到c++的非侵入式接口了，興奮，開心，失望，解脫，…… 。在搞了這么多的面向?qū)ο罂破罩螅救艘惨呀?jīng)開始不耐煩，至此，不想做太多闡述。

雖然，很早就清楚怎么在c++下搞非侵入式接口，但是，整個(gè)框架代碼，重構(gòu)了十幾次之后，才終于滿意。支持給基本類型添加接口，好比int，char，const char*，double；支持泛型，好比vector，list；支持繼承，基類實(shí)現(xiàn)的接口，表示子類也繼承了對(duì)該接口的實(shí)現(xiàn)，而且子類也可以拒絕基類的接口，好比鴨子拒絕基類鳥類“會(huì)飛”，編譯時(shí)報(bào)錯(cuò)；支持接口組合；……，但是，這里僅僅簡(jiǎn)單介紹其原理，并不涉及C++中各種變態(tài)細(xì)節(jié)的處理，C++中，但凡是要正兒八經(jīng)的稍微做點(diǎn)正事，就要面臨無窮無盡的細(xì)節(jié)糾結(jié)。

先看看其使用例子：

1、自然是定義一個(gè)接口：取之于真實(shí)代碼片段

struct IFormatble
{

static TypeInfo* GetTypeInfo();

       virtual void Format(TextWriter& stream, const FormatInfo& info) = 0;
        virtual bool Parse(TextReader& stream, const FormatInfo& info)
        {
            PPNotImplement();
        }
    };

2、接口的實(shí)現(xiàn)類，假設(shè)為int添加IFormatble的接口實(shí)現(xiàn)，實(shí)際代碼肯定不會(huì)這樣對(duì)一個(gè)一個(gè)的基本類型來寫實(shí)現(xiàn)類的代碼。這里只是為了舉例說明。類的名字就隨便起好啦，

    struct ImpIntIFormatble : IFormatble
    {
        int* mThis;    //這一行是關(guān)鍵
        virtual void Format(TextWriter& stream, const FormatInfo& info)override
        {

}

virtual bool Parse(TextReader& stream, const FormatInfo& info)override
{

}
};

這里的關(guān)鍵是，實(shí)現(xiàn)類的字段被規(guī)定死了，最多只能包含3個(gè)指針成員字段，且第1個(gè)字段一定是目的類型指針，第二是類型信息對(duì)象（用于泛型），第三是額外參數(shù)，次序不能亂。成員字段如果不需要用到第二第三個(gè)成員字段數(shù)據(jù)，可以省略不寫，好比這里。所有接口實(shí)現(xiàn)類必須遵守這樣的內(nèi)存布局；

3、裝配，將接口的實(shí)現(xiàn)類裝配到現(xiàn)有的類上，以告訴編譯器該類對(duì)于某個(gè)接口（這里為IFormatble）的實(shí)現(xiàn)，用的是第2步的實(shí)現(xiàn)類ImpIntIFormatble；

PPInterfaceOf(IFormatble, int, ImpIntIFormatble);

4、將實(shí)現(xiàn)類注冊(cè)到類型信息的接口實(shí)現(xiàn)列表中，這一步可以省略，只是為了運(yùn)行時(shí)的接口查詢，相當(dāng)于IUnknown的Query。這一行代碼是在全局對(duì)象的構(gòu)造函數(shù)中執(zhí)行的，放在cpp源文件中

RegisterInterfaceImp<IFormatble, int>();

然后就可以開開心心地使用接口了，比如

int aa = 20;
TextWriter stream(

);
FormatInfo info(

);
            TInterface<IFormatble> formatable(aa); //TInterface這個(gè)名字過難看，也沒辦法了
            formatable->Format(stream, info);
            double dd = 3.14;
            formatable = TInterface<IFormatble>(dd);    //假設(shè)double也實(shí)現(xiàn)IFormatble
            formatable->Format(stream, info);

是否有點(diǎn)神奇呢？其實(shí)也沒什么，不過就是在trait和內(nèi)存布局上做文章，也就只是用了類型運(yùn)算的伎倆。考察ImpIntIFormatble的內(nèi)存布局，對(duì)于普遍的c++編譯器來說，對(duì)象的虛函數(shù)表指針（如果存在的話），都放在對(duì)象的起始地址上，后面緊跟對(duì)象本身的成員數(shù)據(jù)字段，因此，ImpIntIFormatble的內(nèi)存布局相當(dāng)于，

struct ImpIntIFormatble
{
void* vtbl;
int* mThis;
};

注意，這里已經(jīng)沒有繼承了。這就是，實(shí)現(xiàn)了IFormatble 接口的ImpIntIFormatble對(duì)象的內(nèi)存表示。因此，可以想象，所有的接口實(shí)現(xiàn)類的內(nèi)存布局都強(qiáng)制規(guī)定為以下形式：

    struct InterfaceLayout
    {
        const void* mVtbl;
        const void* mThis;            //對(duì)象本身
        const TypeInfo* mTypeInfo;    //類型信息
        const void* mParam;    //補(bǔ)充參數(shù)，一般很少用到
    };

當(dāng)然，如果編譯器的虛函數(shù)表指針不放在對(duì)象起始地址的話，就沒法這么玩了，那么非侵入式接口也無從做起。然后，就是TInterface了，繼承于InterfaceLayout

    template<typename IT>
    struct TInterface : public InterfaceLayout
    {
        typedef IT interface_type;
        static_assert(is_abstract<IT>::value, "interface must have pure function");
        static_assert(sizeof(IT) == sizeof(void*), "Can't have data");
    public:
        interface_type* operator->()const
        {
            interface_type* result = (interface_type*)(void*)this;
            return result;
        }

};

不管怎么說都好，TInterface對(duì)象的內(nèi)存布局與接口實(shí)現(xiàn)類的內(nèi)存布局一致。因此操作符->重載函數(shù)才可以粗暴的類型轉(zhuǎn)換來順利完成。然后構(gòu)造TInterface對(duì)象的時(shí)候就是強(qiáng)制獲取ImpIntIFormatble對(duì)象的虛函數(shù)表（也就是其起始地址的指針數(shù)據(jù)）指針賦值給InterfaceLayout的mVtbl，進(jìn)而依次把實(shí)際對(duì)象的指針放在mThis上，獲取到類型信息對(duì)象放在mTypeInfo中，如果有必要搭理mParam，也相應(yīng)地賦值。

然后，就是template<typename Interface, typename Object>struct InterfaceOf各種特化的運(yùn)用而已，就不值一提了。

由于c++的abi沒有統(tǒng)一標(biāo)準(zhǔn)，并且，c++標(biāo)準(zhǔn)也沒有規(guī)定編譯器必須用虛函數(shù)表來實(shí)現(xiàn)多態(tài)，所以，這里的奇技淫巧并不能保證在所有平臺(tái)上都能夠成立，但是，非侵入式接口真是方便，已經(jīng)是本座寫c++代碼的核心工具，一切都圍繞著非侵入式接口來展開。

原本打算長(zhǎng)篇大論，也只有草草收?qǐng)觥Ｖ螅咀徒夥帕耍瑫?huì)暫時(shí)離開cppblog很久，計(jì)劃中的內(nèi)容，消息發(fā)送，虛模板函數(shù)，字符串，輸入輸出，格式化，序列化， locale，全局變量，模板表達(dá)式，組合子解析器，allocator，智能指針，程序運(yùn)行時(shí)，抽象工廠訪問者等模式的另類實(shí)現(xiàn)，以求從全新的角度上來表現(xiàn)C++的強(qiáng)大，也只能中斷了。

posted @ 2017-07-15 17:01 華夏之火閱讀(2952) | 評(píng)論 (2) | 編輯收藏

再論接口

如果說，類的設(shè)計(jì)思路，是以數(shù)據(jù)為基礎(chǔ)的縱向組織結(jié)構(gòu)，只有唯一的分類方式，有相同基類的，就意味著其相似性，共同點(diǎn)都體現(xiàn)在基類上；那么，接口就是以功能以性質(zhì)從橫向上，來看待類的相似性，并且存在無數(shù)的橫向視角（否則就失去意義）。

靜態(tài)面向?qū)ο笳Z言，這里不考慮template，c++的template是鴨子類型，本質(zhì)上，c++編譯期就是一個(gè)功能完備的動(dòng)態(tài)語言。代碼上的復(fù)用就只能以基類為粒度來進(jìn)行，比如，函數(shù)int fn(Base* bb)，只有Base的子類，才有資格成為函數(shù)fn的會(huì)員。函數(shù)fn之所以聲明其變量bb的類型為Base，就是為了使用類型Base里面的一些東西，一般就是成員函數(shù)（對(duì)于清教徒來說，不是一般，而是必然）。假如，函數(shù)fn的實(shí)現(xiàn)中，就用到Base的幾個(gè)成員函數(shù)，比如說f1，f2，…，fn。換句話說，雖然fn(Base* bb)表面上要求一定要Base的子孫后代才能擔(dān)當(dāng)重任，但實(shí)際上，只要?jiǎng)e的class，不必跟Base有半毛錢關(guān)系，只要這個(gè)class里面支持f1，f2，…，fn這些操作，那么原則上他就有資格到fn里面一游。天下唯有德者居之，不必講究什么貴族。但是，在沒有接口的等級(jí)森嚴(yán)的封建社會(huì)里面，就算你有驚天之地之能，就因?yàn)槟銢]有某種高貴的血統(tǒng)，所以你就不行。

在單根類的王國中，所有對(duì)象都源于Object，也可以通過反射，通過函數(shù)名字運(yùn)行時(shí)獲取串f1，f2，fn等成員函數(shù)，然后再人肉編譯器關(guān)于參數(shù)信息和返回值類型，以擺脫Base的類型桎梏，但是，估計(jì)也只有在最特殊的時(shí)候，才會(huì)這樣玩。這樣玩，簡(jiǎn)直置編譯器的類型檢查于不顧，靜態(tài)語言就是要盡可能的挖掘編譯器類型檢查的最后一絲潛力。

接口的出現(xiàn)，就在縱向的類型關(guān)系上撕開一道道口子，從而盡最大限度釋放對(duì)象的能力。時(shí)代不同了，現(xiàn)在接口IBase里面聲明f1，f2，fn等函數(shù)，然后函數(shù)fn的入?yún)?/span>IBase，也即是 int fn(IBase* bb)，以明確表示fn里面只用到IBase的函數(shù)，語義的要求上更加精準(zhǔn)。然后，任何class，只要其實(shí)現(xiàn)了接口IBase，就有資格被fn接納，不必再是Base之后了。所以說，要面向接口編程，就是要面向功能來搬磚，選擇的樣本空間就廣闊了很多。接口是比具體類型要靈活，但不意味著所有的地方就必須只出現(xiàn)接口，class類型就沒用了，當(dāng)然不是，有些地方就很有必要用具體類型，比如說string類型，比如說復(fù)數(shù)這些，就必須明確規(guī)定具體類型，無須用到接口的靈活性。總之，還是那句話，沒有銀彈，具體問題具體分析。

使用對(duì)象，其實(shí)就是在使用對(duì)象的成員函數(shù)，那么，接口也可以看成是成員函數(shù)的粒度管理工具。所以，接口就表示了一批成員函數(shù)，需要用一批成員函數(shù)的時(shí)候，用接口最為方便。坊間有一些犯virtual恐懼癥的c++猿猴，高高興興地用一批function代替接口，罔顧其性能（時(shí)間空間）的損失、使用上的不便，哎！面向?qū)ο笫菑?qiáng)有力的抽象工具，比之于面向過程，函數(shù)式，有著獨(dú)特的優(yōu)點(diǎn)，反正代碼構(gòu)架上，優(yōu)先使用面向?qū)ο螅^不會(huì)錯(cuò)。而面向?qū)ο螅捅厝换乇懿涣私涌凇?/span>

坊間支持面向?qū)ο笳Z言中對(duì)接口的支持，當(dāng)以rust，scala的trait機(jī)制最為令人喜歡，非侵入式啊，自然狗語言的也還好，但是，本人最反感，反正，狗語言上一切獨(dú)有特性，本人都本能地毫無理由排斥。自然，java、C#或者c++的多繼承，最為笨拙，呆板。

java、C#里面，類能夠?qū)崿F(xiàn)的接口，在類的定義中，就已經(jīng)定下來了。類一旦定義完畢，與該類相關(guān)的接口就定下來，鐵板一塊，密不透風(fēng)，不能增不能減也不能改。你明明看到一個(gè)類就已經(jīng)實(shí)現(xiàn)了某個(gè)接口的所有方法（函數(shù)名字和簽名一模一樣），但就是因?yàn)樵擃悰]有在定義中明確說明實(shí)現(xiàn)該接口，所以編譯器就死活不承認(rèn)該類實(shí)現(xiàn)這個(gè)接口。只能用適配器模式，也即是新造一個(gè)class，實(shí)現(xiàn)該接口，包含舊類的對(duì)象，將接口的所有方法都委托給對(duì)象的相應(yīng)函數(shù)來做。java的繁文縟節(jié)就是這樣來的，規(guī)規(guī)矩矩，畢恭畢敬，一步一個(gè)腳印。更麻煩的是，每次傳遞參數(shù)都要new一個(gè)適配器對(duì)象來滿足參數(shù)的要求，這是最讓人難受的地方。

java、C#的這種接口機(jī)制，實(shí)在與現(xiàn)實(shí)對(duì)不上號(hào)，真是找不到任何原型，任何類型的物品，就算是新造的東西，我們都不可能一開始就窮盡它的所有性質(zhì)所有功能。就算是藥物，都有可能是歪打正著的功能，比如偉哥的功能，是其研發(fā)階段中意想不到的。java、c#的這種接口，會(huì)很干擾類的完整最小化的設(shè)計(jì)原則，進(jìn)而加大類的設(shè)計(jì)難度。當(dāng)然，它也非一無是處，起碼，類支持多少接口，一眼就看出來了，毫無疑義。問題是，接口這種東西，本質(zhì)上就應(yīng)該是不確定的橫向視角來考察類的關(guān)系。java、C#下的接口問題，大大限制了接口的使用場(chǎng)合。

其次，繼承時(shí)，子類就繼承了基類的所有東西，包括其實(shí)現(xiàn)的接口。但是，有些時(shí)候，子類并不想擁有父類的某些接口。比如，鴨子應(yīng)該算是鳥類的一個(gè)子類，而鳥類支持“會(huì)飛”這個(gè)接口，但是鴨子顯然不會(huì)飛，也就是說，雖然鴨子包含了鳥類的所有數(shù)據(jù)，但是它不擁有會(huì)飛這個(gè)功能。對(duì)此，我們希望在編譯期間，就能在要求會(huì)飛的場(chǎng)合下，傳鴨子對(duì)象進(jìn)去時(shí)，編譯器報(bào)錯(cuò)。但是，對(duì)此，只能在運(yùn)行中報(bào)錯(cuò)，而且，還是在調(diào)用會(huì)飛的成員函數(shù)里面才報(bào)錯(cuò)。原則上，編譯器是可以知道鴨子不會(huì)飛這個(gè)概念的，但是，由于java、C#的接口控制粒度單一，滿足不了這種要求。

再次，接口不能組合，比如說，函數(shù)fn的參數(shù)，假設(shè)名字為pp，pp要求同時(shí)實(shí)現(xiàn)接口IA，IB。對(duì)此，java、C#中是沒有語法滿足這種多個(gè)接口的要求。遇到這種需求時(shí)，只能用強(qiáng)制類型轉(zhuǎn)換，先隨便讓參數(shù)類型為IA或者IB，然后在必要時(shí)，強(qiáng)制轉(zhuǎn)換為另外的類型，只能在運(yùn)行時(shí)報(bào)錯(cuò)。又或者是，新造一個(gè)接口IAB從IA，IB上繼承，然后函數(shù)fn的參數(shù)pp的類型為IAB，但是這樣，依然存在不足，假如某個(gè)類實(shí)現(xiàn)IA和IB，但是沒有表明它實(shí)現(xiàn)IAB，那么還是不能滿足參數(shù)的要求。接口組合的問題，不管是go、rust，都沒有很好的支持，只能到運(yùn)行時(shí)類型轉(zhuǎn)換才能發(fā)生。

最重要的是，這種接口機(jī)制違反了零懲罰的機(jī)制。就以c++為例來說明，就只論接口好了，也即是只有虛函數(shù)但是沒有成員字段的基類。為了方便描述，還是舉例子。

struct IA {virtual void fa() = 0;};
struct IB {virtual void fb() = 0;};
struct Base{…};
struct Derived : public Base, public IA, public IB{…};

接口IA有虛函數(shù)，里面就要有一個(gè)指針指向其虛函數(shù)表，所以其內(nèi)存占用就是一個(gè)指針的大小；同理，IB也如此。表面的意思是Derived實(shí)現(xiàn)了接口IA，IB，實(shí)際上，在C++中，接口實(shí)現(xiàn)就是繼承，也就是說每個(gè)Derived的實(shí)例都要包含IA，IB里面的數(shù)據(jù)，指向?qū)?yīng)虛函數(shù)表的指針字段，也即是有兩個(gè)指針。這里做不到零懲罰的意思，是說， Derived為了表明自己有IA、IB的能力，每個(gè)對(duì)象付出了兩個(gè)多余的內(nèi)存指針空間的代價(jià)，即便是對(duì)象不需要在IA、IB的環(huán)境下使用，這個(gè)代價(jià)都避免不了。零懲罰抽象，就是要用到的時(shí)候才付出代價(jià)，哪怕這個(gè)代價(jià)可以大一點(diǎn)。用不到時(shí)，則不必消耗哪怕一點(diǎn)點(diǎn)空間時(shí)間上的浪費(fèi)。空間上浪費(fèi)的問題不在于節(jié)省內(nèi)存，而在于喪失了精致的內(nèi)存布局，進(jìn)而影響到二進(jìn)制的復(fù)用。這一點(diǎn)，非侵入式接口就不用也沒辦法在對(duì)象身上包含其所支持的所有接口的虛函數(shù)表指針，因?yàn)轭愋投x完畢，后面還可能在其上添加新的接口實(shí)現(xiàn)。

而由這幾點(diǎn)問題引申出來的其他缺陷就不必提了。反正，C++，包括java，C#的這種接口機(jī)制最不討人喜歡了。

至于狗語言的鴨子接口，有時(shí)會(huì)出現(xiàn)函數(shù)名字沖突的小問題，稍微改一下名字就好了。主要是這種接口機(jī)制只要一個(gè)類包含了某個(gè)接口的所有成員函數(shù)，就隱式認(rèn)為它實(shí)現(xiàn)了這個(gè)接口。這里會(huì)有暗示（誤導(dǎo)，誘惑），就是定義類的成員函數(shù)時(shí)，會(huì)有意或者無意地遷就現(xiàn)有接口的成員函數(shù)，同樣，聲明接口成員函數(shù)時(shí)，也會(huì)有意無意地往現(xiàn)有類的成員函數(shù)上靠。從而導(dǎo)致真正函數(shù)的語義上把控不夠精準(zhǔn)。并且，這種機(jī)制太過粗暴，萬一這個(gè)類雖然支持某個(gè)接口的所有函數(shù)，但是并不一定就意味著它就要實(shí)現(xiàn)這個(gè)接口了。狗語言最令人反感之處就是各種自作聰明自以為是的規(guī)定。當(dāng)然，由于狗語言的成員函數(shù)可以非侵入式，這個(gè)問題造成的不便一定程度上有所減輕，但是，說實(shí)在，就連非侵入式的成員函數(shù)，本座也不太喜歡了。另外，僅僅從語言層面上，不借助文檔，很難知道一個(gè)類到底實(shí)現(xiàn)那些接口，某個(gè)接口被那些類實(shí)現(xiàn)，java、C#的接口在這一點(diǎn)的表現(xiàn)上就很卓越。其實(shí)，本座反感狗語言的最大原因還是因?yàn)楣贩郏啾戎拢?/span>java粉、php粉等粉，就可愛多了。

rust以trait形式實(shí)提供的接口機(jī)制就不多說了，語法形式上簡(jiǎn)潔漂亮，基本上夢(mèng)寐以求的接口樣子就是這樣子的了。

以上語言的接口，全部屬于靜態(tài)接口，也即是類型所實(shí)現(xiàn)的接口在編譯期間就全部定下來了，運(yùn)行時(shí)就不再有任何變化。但是，如果對(duì)象一直在變化，好比生物，就說人類好了，有嬰兒少年青年中年老年死亡這些變化階段，顯然每一階段的行為能力都大不一樣，也擁有不同頭銜，不同身份。也就是說，現(xiàn)實(shí)中，活生生對(duì)象的接口集合并非一成不變，它完全可以現(xiàn)在就不支持某個(gè)接口，高興時(shí)候又可以支持了，不高興時(shí)就又不支持了，聾了就聽不到聲音，盲了就看不見，好似消息發(fā)送那樣子，顯然以上語言是不支持這種動(dòng)態(tài)需求的接口的。

另外，com的接口查詢雖然發(fā)生在運(yùn)行時(shí)，但是，com的規(guī)范，比如對(duì)稱性、傳遞性、時(shí)間無關(guān)性等規(guī)則，硬是把com從動(dòng)態(tài)接口降維到靜態(tài)接口，這也可以理解，因?yàn)閯?dòng)態(tài)接口的應(yīng)用場(chǎng)景真的并不多。這些都沒什么，com最根本的問題，還是在于接口要承載類的功能，當(dāng)然，這樣也有好處，比如語言的無關(guān)性。IUnknown的三大成員函數(shù)分明就是類的本職工作，AddRef，Release管理對(duì)象的生命周期，Query查詢所要的接口。生命周期由對(duì)象粒度細(xì)化為接口粒度，就顯得太瑣碎，要謹(jǐn)記好幾條規(guī)則，要小心翼翼地應(yīng)付AddRef，Release的函數(shù)調(diào)用，智能指針也只能減輕部分工作量，這就是粒度過小帶來的痛苦。而Query的本質(zhì)就是對(duì)象所實(shí)現(xiàn)接口集合，這是對(duì)象的本分工作，現(xiàn)在搞成接口與接口之間的關(guān)系。由于接口越俎代庖，承接了類的職責(zé)，就要求每個(gè)接口都要繼承IUnknown，本來接口之間就應(yīng)該沒什么關(guān)聯(lián)性的才對(duì)，還導(dǎo)致com的實(shí)現(xiàn)以及使用，在c++下，非常繁復(fù)麻煩，令人頭皮發(fā)麻。所以說，類與接口，一體兩面，誰也不能代替誰。

---------------------------------------------------------------------------------------------------------------------------------

備注：現(xiàn)實(shí)世界中，一種或幾種功能就能推導(dǎo)出來其他性質(zhì)，對(duì)應(yīng)到接口中，就是如果對(duì)象實(shí)現(xiàn)某些接口，就表示它能實(shí)現(xiàn)另外其他接口。目前的語言，也就是接口繼承，子接口繼承父接口，那么，如果一個(gè)類實(shí)現(xiàn)了子接口，就表示它也實(shí)現(xiàn)了父接口，語言明面上只支持這種接口的蘊(yùn)含關(guān)系。對(duì)于其他的蘊(yùn)含情況，只能用適配器來湊數(shù)，而在非侵入式接口中，其語言形式就顯得更加的累贅，這一點(diǎn)，在java上尤為突出。其實(shí)，說到底，適配器模式只是彌補(bǔ)語言不支持接口蘊(yùn)含機(jī)制的產(chǎn)物。

posted @ 2017-07-15 11:42 華夏之火閱讀(868) | 評(píng)論 (0) | 編輯收藏

2017年7月14日

c++面向?qū)ο蟮念愒O(shè)計(jì)

類的設(shè)計(jì)在于用恰到好處的信息來完整表達(dá)一個(gè)職責(zé)清晰的概念，恰到好處的意思是不多也不少，少了，就概念就不完整；多了，就顯得冗余，累贅，當(dāng)然特例下，允許少許的重復(fù)，但是，這里必須要有很好的理由。冗余往往就意味著包含了過多的信息，概念的表達(dá)不夠精準(zhǔn)，好比goto，指針，多繼承這些貨色，就是因?yàn)槠溥^多的內(nèi)涵，才要嚴(yán)格限制其使用。好像，more effective c++上說的，class的成員函數(shù)，應(yīng)該是在完整的情況下保持最小化。但是，這里我們的出發(fā)點(diǎn)，是成員數(shù)據(jù)的完整最小化。

最小化的好處是可以保持概念最大的獨(dú)立性，也意味著，可以用最小的代價(jià)來實(shí)現(xiàn)這個(gè)概念，也意味著對(duì)應(yīng)用層的代碼要求越少，非侵入式？好比c++11 noexcept取代throw()，好比從多繼承中分化出來接口的概念，好比不考慮多繼承虛繼承的普通成員函數(shù)指針。又比如，如果不要求只讀字符串以0結(jié)束，那么就可以把只讀字符串的任何一部分都當(dāng)成是只讀字符串。類的對(duì)外功能固然重要，但是，類不能做的事情，也很重要。

首先是要有清晰的概念以及這個(gè)概念要支持的最基本運(yùn)算，然后在此基礎(chǔ)上組織數(shù)據(jù)，務(wù)求成員數(shù)據(jù)的最小化。當(dāng)然，概念的產(chǎn)生，并非拍著腦袋想出來的，是因?yàn)榇a里面出現(xiàn)太多那種相關(guān)數(shù)據(jù)的次數(shù)，所以就有必要把這些數(shù)據(jù)打包起來，抽象成一個(gè)概念。好比說，看到stl算法函數(shù)參數(shù)到處開始結(jié)束的迭代器，就有必要把開始結(jié)束放在一起。比如說，string_view的出現(xiàn)，這里假設(shè)其字符存儲(chǔ)類型為char，string_view就是連續(xù)char內(nèi)存塊的意思，可以這樣表示

struct string_view

{

const char* textBegin;

size_t length; //或者 const char* textEnd

};

這里的重點(diǎn)是，string_view里面的兩個(gè)成員字段缺一不可，但是也不必再添加別的什么其他東西。然后，在這兩個(gè)數(shù)據(jù)上展開實(shí)現(xiàn)一系列的成員函數(shù)，這里，成員函數(shù)和成員字段這兩者，有一點(diǎn)點(diǎn)雞生蛋生雞的糾結(jié)，因?yàn)楸匾蓡T函數(shù)的集合（原始概念的細(xì)化），成員函數(shù)決定了成員字段的表示，而成員字段定下來之后，這反過來又能夠驗(yàn)證成員函數(shù)的必要性。不管怎么說都好，成員函數(shù)的設(shè)計(jì)，也必須遵從最小完整化的原則。再具體一點(diǎn)，就是說但凡一個(gè)成員函數(shù)可以通過其他成員函數(shù)來實(shí)現(xiàn)，就意味著這個(gè)函數(shù)應(yīng)該趕出類外，作為全局函數(shù)存在。當(dāng)然，這也不是死板的教條，有些很特殊的函數(shù)，也可以是成員函數(shù)，因?yàn)槌蓡T函數(shù)的使用，確實(shí)很方便。

可能會(huì)有疑惑，感覺所有的成員函數(shù)其實(shí)都可以是全局函數(shù)。或者說，我們可以對(duì)每一個(gè)成員字段都搞一對(duì)set、get的函數(shù)，那么所有的其他成員函數(shù)就可以是全局函數(shù)的形式，很容易就可以遵守最小完整化的原則。當(dāng)然，這是明顯偷懶，拒絕思考的惡劣行為。與其這樣，還不如就開放所有的成員字段，那樣子就落入c語言的套路了。所以的法論是，一個(gè)函數(shù)，這里假設(shè)是全局函數(shù)，如果它的實(shí)現(xiàn)必須要訪問到成員字段，不能通過調(diào)用該類的成員函數(shù)（一般不是get，set）來達(dá)到目的，或者，也可以強(qiáng)行用其他函數(shù)來完成任務(wù)，但是很麻煩，或者要付出時(shí)間空間上的代價(jià)，那么就意味著這個(gè)函數(shù)應(yīng)該是該類的成員函數(shù)。

類的設(shè)計(jì)，就是必不可少的成員字段和必不可少的成員函數(shù)，它們一起，實(shí)現(xiàn)了對(duì)類的原始概念的完整表達(dá)，其他什么的，都不必理會(huì)。一個(gè)類如果不好寫，往往意味著這個(gè)類的功能不專一，或者其概念不完整，這時(shí)，可以不要急著抽象，如果一個(gè)類有必要誕生，那么在代碼的編寫中，該類的抽象概念將一再重復(fù)出現(xiàn)，猿猴對(duì)它的理解也越來越清晰，從而，水到渠成地把它造出來。所有非需求推動(dòng)，非代碼推動(dòng)的，拍著腦袋，想當(dāng)然的造類行為，都是在臆造抽象，脫離實(shí)際生活的藝術(shù)，最終將被淘汰。

類的設(shè)計(jì)，其著眼點(diǎn)在于用必要的數(shù)據(jù)來完整表達(dá)一個(gè)清晰的概念。而繼承，則是對(duì)類的概念進(jìn)行細(xì)化，也就是分類，好比說生物下面開出來動(dòng)物、植物這兩個(gè)子類，就是把生物分成動(dòng)物、植物這兩類，繼承與日常生活的分類不太一樣，繼承的分類方式是開放式，根據(jù)需要，隨時(shí)可以添加新的子類別。整個(gè)類的體系，是一顆嚴(yán)格的單根樹，任何類只能有一個(gè)根類。從任何類開始，只能有一條路徑回溯到最開始的根類，java、C#中就是Object，所有的類都派生自Object，這是一棵大樹。單根系下，萬物皆是對(duì)象，這自然很方便，起碼，這就從語言層面上直接支持c++ std的垃圾any了。而由于java、C#完善的反射信息，拋棄靜態(tài)類型信息，也可以做動(dòng)態(tài)語言層面上的事情，而c，c++的void*，所有的動(dòng)態(tài)類型信息全部都在猿猴的大腦中。java平臺(tái)上生存著大把的動(dòng)態(tài)語言，而且，性能都還很不錯(cuò)。

相對(duì)很多語言來說，c++就是怪胎就是異數(shù)，自有其自身的設(shè)計(jì)哲學(xué)，它是多根系的，它不可能也沒必要搞成單根系，當(dāng)然，我們可以假設(shè)一個(gè)空類，然后所有的類都默認(rèn)繼承自這個(gè)空類。c++的所有類組成一個(gè)森林，森林里的樹都長(zhǎng)自大地。但是不管怎么說都好，只能允許單繼承，千萬不要有多繼承，這是底線，千萬千萬不能違背（當(dāng)然，奇技淫巧的場(chǎng)合，就不必遵守這個(gè)戒條，多繼承千般不是，但是不可或缺，因?yàn)樗梢酝娉鰜砗芏嗷樱⑶叶己軐?shí)用很必要）。最起碼，單根系出來的內(nèi)存布局直觀可預(yù)測(cè)，一定程度上跨編譯器，只有良好的內(nèi)存布局，才有望良好的二進(jìn)制復(fù)用。另外，父類對(duì)子類一無所知，不要引用到子類一丁點(diǎn)的信息，要保持這種信息的單向流動(dòng)性。

在這種單根系的等級(jí)分明的階級(jí)體系下，一切死氣沉沉，沒有一點(diǎn)點(diǎn)的社會(huì)活力。顯然，只有同屬于同一父類的類別之間，才能共享那么一丁點(diǎn)可憐的共性。如果沒有接口搗亂，將是怎樣的悲劇，最好的例子，mfc，真是厲害，沒有用到接口，居然可以做出來嚴(yán)謹(jǐn)滿足大多數(shù)需要的gui框架，沒有接口，并不表示它不需要，因?yàn)?/span>mfc開了后門，用上了更厲害的玩意----消息發(fā)送，即便如此，mfc有些地方的基類還有依賴到子類，這就很讓人無語了。

c++下，類的設(shè)計(jì)絕對(duì)不對(duì)兒戲，一定要清楚自己想要的是什么，抽象出來的概念才不會(huì)變成垃圾。大而全的類，遠(yuǎn)遠(yuǎn)不如幾個(gè)小而專的細(xì)類。java，C#下的類開發(fā)很方便，但是粒度過大，把一攬子的東西都丟給你，強(qiáng)賣強(qiáng)買，反正只要類一定義，必然相應(yīng)的就會(huì)出現(xiàn)一大坨完善的反射信息，而對(duì)象里面也包含了一些無關(guān)緊要的成員字段，而對(duì)象的訪問，也全部都是間接引用的訪問，雖然，現(xiàn)在計(jì)算機(jī)性能過剩，這些都無傷大雅。c++給了開發(fā)者最大的選擇，而搞c++的猿猴，基本上都智力過剩，對(duì)于每種選擇，都清楚其背后的代價(jià)以及所要到達(dá)的目的，所以雖然開發(fā)時(shí)候，存在心智包袱影響開發(fā)效率，但是，但內(nèi)心就不會(huì)存在什么性能包袱的負(fù)罪感。就個(gè)人而言，還是喜歡c++這種最高自由度的語言，有時(shí)候，對(duì)于內(nèi)存最細(xì)致的控制，可以得到更精簡(jiǎn)的設(shè)計(jì)，這里無關(guān)運(yùn)行性能，好比說，在c++中，只要內(nèi)存布局一致，即便是不同類型的對(duì)象，通過強(qiáng)制類型轉(zhuǎn)換來統(tǒng)一對(duì)待，進(jìn)而做匪夷所思之事，好比COM里面，為了聚合復(fù)用，一個(gè)類，竟然可以針對(duì)同一個(gè)接口提供兩套實(shí)現(xiàn)方式。這種方便，在其他強(qiáng)類型語言中是不支持的。

某種意義上講，c++在面向?qū)ο笊咸峁┑恼Z言機(jī)制，就是為了方便地生成各種內(nèi)存布局，以及此內(nèi)存布局上所能支持的操作，虛函數(shù)用以生成一堆成員函數(shù)指針，繼承則用以方便地生成一坨成員字段，……。所以，c++的面向?qū)ο缶褪敲嫦騼?nèi)存布局地設(shè)計(jì)，而多繼承、虛繼承、模板這些鬼東西很容易就導(dǎo)致內(nèi)存布局的失控，不過，如果使用得當(dāng)，卻又有鬼斧神工之奇效，創(chuàng)造出來其他語言所沒有的奇跡。真的，論動(dòng)態(tài)行為藝術(shù)，任何語言在c++這個(gè)大人面前都是幼兒園里的小學(xué)生。

為了引出接口，本座花大力氣做科普。這也沒辦法，因?yàn)轭愲m然是基礎(chǔ)，但是靜態(tài)面向?qū)ο蟮木A，全部都在接口上。只有清晰明確類的功能職責(zé)，才能理解接口的必要性以及其多樣性。那么，可不可以只有接口，沒有類的。可以，就好像com那樣子，而代價(jià)是，使用起來，各種不方便。這個(gè)世界，從來就不存在包治百病之萬能藥。什么事情都能做的意思就是什么都做不好。

posted @ 2017-07-14 11:48 華夏之火閱讀(1424) | 評(píng)論 (0) | 編輯收藏

2017年7月12日

c++的面向?qū)ο笾皞?/a>

此文只是雜亂的記錄一點(diǎn)點(diǎn)對(duì)于面向?qū)ο蟮膫€(gè)人看法，有些觀點(diǎn)也并非原創(chuàng)。沒什么系統(tǒng)性可言，雖然筆者稍作整理，但始終還是顯得很散亂，只是一些片段的堆積。

由于涉及的題目過于龐大，反而不知道如何下筆。先羅列一下問題，之間沒有嚴(yán)格的先后之分，純粹就是筆者想到哪里，就寫到哪里。也不一定就會(huì)解答。繼承的本質(zhì)是什么？為什么一定要有接口？c++多繼承為何飽受非議，真的就一無是處？為何筆者就反感go接口，反正go獨(dú)有的一切，筆者都是下意識(shí)的排斥？功能繁雜的Com，結(jié)合C++的自身特點(diǎn)，能否改頭換面？ ……

在原教旨眼里，面向?qū)ο蟮慕塘x就是“對(duì)象+消息發(fā)送”，整個(gè)程序由對(duì)象組成，而對(duì)象之間的就僅僅只通過發(fā)送消息響應(yīng)消息來交互，程序的功能都是在對(duì)象與對(duì)象的來回消息發(fā)送中完成，用現(xiàn)實(shí)事情類比，人類就是一個(gè)個(gè)活生生的對(duì)象，人類通過消息的往來，比如語音、文字、廣播等，有人制造新聞，有人接受到這些消息后，各自反應(yīng)，最后完成一切社會(huì)活動(dòng)。好像說得有點(diǎn)抽象，展開來說，其實(shí)就是，消息的發(fā)送者，原則上不需要事先了解目標(biāo)對(duì)象的任何背景資料，甚至他明知道對(duì)方不鳥消息，比如說，明明對(duì)方就是一個(gè)乞丐，但是并不妨礙你向他借500萬人民幣，反正，消息就是這樣發(fā)送出去的。然后，對(duì)象接受到消息之后，就各自反應(yīng)，比如說有人真的借錢給你；有人哭窮；有人嘀咕你到處借錢，無恥；……，各式各樣，不一而足。

聽起來好像人類社會(huì)活動(dòng)就是消息的往來下推動(dòng)，艱難的前進(jìn)，但是，這能拿來搬磚嗎？可以的，真的可以！即便是C語言，都可以來搞消息發(fā)送這種高大上的事情，就好像win32那樣子，通過SendMessage函數(shù)給窗口發(fā)送消息，其簽名如下：

LRESULT SendMessage(HWND hWnd, UINT Msg, WPARAM wParam, LPARAM lParam);

好像參數(shù)有點(diǎn)多。說白了，消息發(fā)送就相當(dāng)于成員函數(shù)函數(shù)調(diào)用的一個(gè)新馬甲，換了一種說法而已。成員函數(shù)調(diào)用，形式是這樣子，obj.fn(param1, param2, …)，涉及到對(duì)象，函數(shù)名字，還有參數(shù)，可能參數(shù)數(shù)量不止一個(gè)，參數(shù)類型也各不一樣，這些都沒關(guān)系。hWnd為窗口，也即是對(duì)象；Msg為函數(shù)名稱，現(xiàn)在用正整型編號(hào)來代表，有些消息發(fā)送系統(tǒng)用原子，qt好像是用字符串（性能堪憂啊）；wParam，lParam可以看成void*類型，也即是函數(shù)的參數(shù)，用這兩個(gè)值封裝所有的參數(shù)。天真，天下函數(shù)參數(shù)類型成千上萬，參數(shù)數(shù)目或0個(gè)、或1個(gè)、或三五個(gè)、或七八個(gè)，就wParam，lParam這兩個(gè)弱雞，就能封裝得過來？可以的，通過強(qiáng)制類型轉(zhuǎn)換，就可以讓void*的值保存char、int、float等值，又或者是將參數(shù)打包為結(jié)構(gòu)體，這樣子，就可以應(yīng)付千千萬萬的函數(shù)參數(shù)要求，這樣子，不要說，有兩個(gè)wParam，lParam來傳遞參數(shù)，就算是只有一個(gè)，也都可以應(yīng)付千千萬萬的函數(shù)要求。

那么，如何響應(yīng)消息？可以參考win32的原生api開發(fā)，這里就不展開了。原理就是，每個(gè)對(duì)象都有一個(gè)函數(shù)指針，那個(gè)函數(shù)把全部的成員函數(shù)都?jí)嚎s在一個(gè)龐大的switch語句里面，每個(gè)消息編號(hào)case分支，就代表一個(gè)成員函數(shù)，顯然，這個(gè)分支，要先將wParam，lParam里面在還原成對(duì)應(yīng)參數(shù)的實(shí)際情況，然后再執(zhí)行相應(yīng)操作。

SendMessage顯然抹去了所有窗口的具體類型信息，甭管你是按鈕、漂亮按鈕、菜單、編輯框、……，全部一律都退化成窗口對(duì)象。要往編輯框里面添加文字，就給它發(fā)送添加文字的消息，wParam，lParam就帶著要添加的文本和長(zhǎng)度。而不是調(diào)用編輯框的添加文字的成員函數(shù)來做這個(gè)事情，最明顯的事情，就是也可以給按鈕窗口也發(fā)送添加文本的消息，雖然按鈕窗口對(duì)此消息的反應(yīng)是啥也不做。令人驚訝的是，你可以子類化一個(gè)按鈕窗口，讓它對(duì)添加文本的消息做出反應(yīng)，這完全是可以的。

顯然，原教旨的面向?qū)ο蠼塘x，的而且確，靈活，解耦徹底，不同類型對(duì)象之間的耦合關(guān)系一律不復(fù)存在，之間只有消息的往來。隨心所欲的發(fā)送消息（胡亂調(diào)用成員函數(shù)），自由自在的反應(yīng)消息（一切全無契約可言），不理睬，或者這一刻不理睬下一刻又動(dòng)了，或者這一刻動(dòng)了下一刻又拒絕反應(yīng)。甚至，消息還可以保存，排隊(duì)，求反，疊加什么的，也即是消息已經(jīng)是一種抽象數(shù)據(jù)類型了，支持多種運(yùn)算。相比于不知所謂的基于類的靜態(tài)面向?qū)ο螅ɡ^承封裝多態(tài)），簡(jiǎn)直不可同日而語，太多的約束，呆板的語法，深入的哲學(xué)思考，架床疊屋的類型關(guān)系，也好意思學(xué)人家叫面向?qū)ο蟆?/span>

當(dāng)然，對(duì)象+消息發(fā)送這種機(jī)制，付出的代價(jià)也是很巨大的，基本上，函數(shù)調(diào)用的靜態(tài)類型檢查不服存在，所有問題都要到運(yùn)行時(shí)才能發(fā)現(xiàn)。并且，消息發(fā)送的語法也很不直觀，必須各種類型轉(zhuǎn)換，而響應(yīng)消息時(shí)又必須轉(zhuǎn)換回去。此外，為函數(shù)定義消息編號(hào)，也很惡心。不過，這些在動(dòng)態(tài)語言里面都不是問題，反正，動(dòng)態(tài)語言里面沒有靜態(tài)類型約束。另外，筆者用template、全局變量、宏等奇技淫巧，在c++里面，已經(jīng)實(shí)現(xiàn)了類型安全的消息發(fā)送框架，比如，Send(obj, kAppendText, U8String(“hello”))，而對(duì)象實(shí)現(xiàn)對(duì)消息的響應(yīng)，直接也是成員函數(shù)的形式，并且還是非侵入式的，也即是說，在main函數(shù)之前，可以隨時(shí)在任意地方給對(duì)象添加新的消息反射，所有參數(shù)上類型轉(zhuǎn)換以及返回值上的類型轉(zhuǎn)換，全部都不需要了。但即便是這樣，也不贊成原教旨的面向?qū)ο蟮教幏簽E。原因是，用它寫出來的程序，類型層次很不清晰，相比于架構(gòu)良好的類形式的面向?qū)ο蟪绦颍勺x性遠(yuǎn)遠(yuǎn)不如，也不好維護(hù)。更深刻的原因是，對(duì)象+消息發(fā)送的威力太驚人，用途太廣，任何多態(tài)上的行為，都可以用它來做。什么都可以做，就意味著什么都盡量不要讓他來做。

其實(shí)，即便java、C#這種繼承封裝多態(tài)的面向?qū)ο笄О闳蹼u各種繁文縟節(jié)，也不妨礙人家稱霸天下，到處流行。你對(duì)象+消息發(fā)送再美妙，流行度都不及人家java一個(gè)零頭，obj c還不是靠著ios的流行才有所起色，擠入排行榜十名內(nèi)。雖然說市場(chǎng)不能說明什么，但是對(duì)比如此懸殊，自有其道理。

再說，靜態(tài)類型的成員函數(shù)調(diào)用模式，廣泛存在于人類社會(huì)活動(dòng)中。人與人之間的很多事情，其實(shí)只要滿足一定的條件，必然就會(huì)發(fā)生，其后果也可以預(yù)料。很多消息的發(fā)送，其實(shí)是有考慮到對(duì)方的身份問題，才會(huì)發(fā)起，好比小孩子跟爸媽要零用錢的消息，小孩子再發(fā)送要零用錢的消息，一定是針對(duì)親人才發(fā)起的。真相是，往往要滿足一些必要條件，消息才得以發(fā)起，當(dāng)然，只要你高興，隨時(shí)都可以發(fā)起任何消息，問題是，這種人多半不正常。量體裁衣，針對(duì)什么樣的問題，就應(yīng)該采用相應(yīng)的手段，一招鮮吃遍全天下，行不通的。具體問題，必須具體分析。每種問題，都有自己最獨(dú)特有效的解法。筆者在原教旨的面向?qū)ο笊现貜?fù)太多內(nèi)容，連自己都惡心，以后應(yīng)該很少再提及。

所以說，面向?qū)ο蟮脑O(shè)計(jì)，首先應(yīng)該采用的必然還是繼承封裝多態(tài)的思路。在此基礎(chǔ)上，根據(jù)不同的動(dòng)態(tài)要求，采用不同策略來應(yīng)對(duì)。企圖用萬能的消息發(fā)送來代替靜態(tài)類型面向?qū)ο蟮幕闹嚲腿缤媒┗拿嫦驅(qū)ο髞砟M一切動(dòng)態(tài)行為，兩者都是犯了同樣的毛病。可是，靜態(tài)面向?qū)ο笞鲈O(shè)計(jì)，又確實(shí)困難重重，而最終的開發(fā)成果，總是讓人難以滿意。那是因?yàn)椋瑥V大勞動(dòng)群眾對(duì)靜態(tài)面向?qū)ο笠恍┗靖拍畹睦斫猓嬖谶@樣那樣的誤區(qū)，而由于面向?qū)ο笳Z言（java，C#）還缺乏一些必要機(jī)制，導(dǎo)致設(shè)計(jì)上出現(xiàn)妥協(xié)，原則性的錯(cuò)誤越積越深，以至于最后崩盤。其實(shí)，不要說一般人，就連大人物，在面向?qū)ο笊希捕贾皇翘剿鳎帽?/span>c++之父BS，搞出來多繼承，虛繼承，iostream體系，在錯(cuò)誤的道路上，越走越遠(yuǎn)，越走越遠(yuǎn)。

好吧，其實(shí)，多繼承，還是很有作用的，在很多奇技淫巧上很有用武之地，很方便。但是，用多繼承做架構(gòu)的危險(xiǎn)，就在于其功能太過強(qiáng)大。這就意味著它要淪落成為goto啊、指針啊那樣的角色，先甭管它鉆石尷尬。多繼承的最重要角色，概念實(shí)現(xiàn)，也即是接口，也即是定義一批虛函數(shù)，里面沒有任何數(shù)據(jù)，這個(gè)抽象就必須鮮明，這一點(diǎn)，java和C#就做得很到位。就應(yīng)該從多繼承上提煉出來這么一個(gè)好東西，咦，對(duì)了，為何要有接口？沒有接口，就真的不行嗎？是的，靜態(tài)面向?qū)ο罄锩妫涌诖_實(shí)必不可少。

繼承，本質(zhì)上就是分類學(xué)。而分類，最重要一點(diǎn)，就是任何一件元素，必須也只能只屬于其中一個(gè)類，不得含糊。可以存在多種分類方式，但是，一旦確定某種分類方式，那么集合里面的一個(gè)東西，就必須只能屬于其中一大類。繼承，就是分類的一再細(xì)化，也是概念的繼續(xù)豐富。比如說，從生物到動(dòng)物到哺乳動(dòng)物，概念包含的數(shù)據(jù)越來越多。所以說，繼承體現(xiàn)的是數(shù)據(jù)上的豐富關(guān)系，它強(qiáng)調(diào)的是數(shù)據(jù)的積累，從遠(yuǎn)古基類開始，一路積累下來的數(shù)據(jù)，全部必不可少，也不得重復(fù)，一旦違反這條底線，就意味著繼承體系上的錯(cuò)亂。繼承，相當(dāng)于類型的硬件，缺乏硬件元器件時(shí)，就無法完整表達(dá)該類型的概念。比如說，人類可分為男人、女人，自然，男人有男人的陽剛，女人有女人的陰柔，那么陰陽同體怎么辦，集兩性之所長(zhǎng)，難道就要陰陽人多繼承與男人女人嗎？那么，這樣繼承下來，陰陽人豈不是就是有兩個(gè)頭，四只手，四條腿了，啊，這不是陰陽人，這是超人，抑或是怪物。所以，陰陽人應(yīng)該是人里面的一個(gè)分支，也即是，人的分類，就要有男人、女人、陰陽人這三大基類。再次強(qiáng)調(diào)，繼承是為了繼承數(shù)據(jù)，而不是為了功能，功能只不過是數(shù)據(jù)的附帶品。那么，怎么描述男人的陽剛、女人的陰柔，怎么避免陰陽人引入后，分別從男人陽剛，女人陰柔上復(fù)制代碼呢？此外，再次考慮平行四邊形，下面好像又有菱形，有矩形兩大類，然后身集菱形矩形的正方形，這里的分類該如何處理，難道忍不住要讓正方形多繼承菱形矩形嗎？從這個(gè)意義上講，在同一體系下，多繼承的出現(xiàn)，理所當(dāng)然，大錯(cuò)特錯(cuò)，由此可知，iostream就是敗類。iostream通過虛繼承避免絕世鉆石的出現(xiàn)，但是這個(gè)虛繼承啊，真是要讓人呵呵。C++中引入虛繼承真是，怎么說呢，好吧，也算腦洞大開的優(yōu)良物品，也不是完全一無是處，起碼，在iostream上就大派用場(chǎng)了。你就說說，虛繼承那點(diǎn)不好了？就一點(diǎn)，為了子子類的千秋基業(yè)，子類必須虛繼承基類，子類受子子類影響，就這一點(diǎn)，你能忍。

突然發(fā)現(xiàn)，文章已經(jīng)很長(zhǎng)了，不管了，這就打住。至于非侵入式接口，以后再說吧！

posted @ 2017-07-12 18:17 華夏之火閱讀(858) | 評(píng)論 (1) | 編輯收藏

2017年7月11日

再議c++的面向?qū)ο竽芰χ?/a>

C++的面向?qū)ο笤O(shè)計(jì)能力，與java，C#這兩個(gè)雜碎相比，一直都是一個(gè)大笑話，現(xiàn)在誰敢正兒八經(jīng)地用c++搞面向?qū)ο蟮目蚣芟到y(tǒng)，業(yè)界都用java、C#搞設(shè)計(jì)模式，那關(guān)C++什么事情了。而C++也很有自知之明，很知趣，98年之后，就不怎么對(duì)外宣稱自己是面向?qū)ο蟮恼Z言，就不怎么搞面向?qū)ο笱芯苛耍y道是c++下的面向?qū)ο笠呀?jīng)被研究透徹？），一直在吃template的老本，一直到現(xiàn)在，template這筆豐厚的遺產(chǎn)，貌似還夠c++吃上幾十年。今時(shí)今日，virtual早就淪落為template的附庸，除了幫助template搞點(diǎn)類型擦除的行為藝術(shù)之外，就很難再見到其身影了。有那么幾年，業(yè)界反思c++的面向?qū)ο蠓妒剑?/span>virtual，特別是function出現(xiàn)之后，要搞動(dòng)態(tài)行為，就更加不關(guān)virtual的什么事情了。而那幾年，本座也學(xué)著大神忌諱virtual關(guān)鍵字。現(xiàn)在大家似乎已經(jīng)達(dá)成共識(shí)，c++里頭的面向?qū)ο竽芰懿煌晟疲婷嫦驅(qū)ο缶蛻?yīng)該找其他語言，比如java、C#雜碎；或者更動(dòng)態(tài)類型的語言，好比python，Ruby；或者干脆就是原教旨的面向?qū)ο螅ㄏl(fā)送），object C，smalltalk。

是啊，1、沒有垃圾回收；2、沒有原生支持的完善反射能力；3、多繼承、虛繼承導(dǎo)致的復(fù)雜內(nèi)存布局。這三座大山面前，c++的碼猿哪敢染指什么面向?qū)ο螅辉谄炔坏靡训那闆r下，小心翼翼地使用virtual。但是，事實(shí)上，要玩面向?qū)ο螅?/span>c++原來也可以玩得很炫，甚至，可以說，關(guān)于面向?qū)ο蟮哪芰Γ?/span>c++是最強(qiáng)的（沒有之一）。這怎么可能？

所謂的面向?qū)ο螅f白了，就是對(duì)動(dòng)態(tài)行為的信息支持，能在面向?qū)ο笤O(shè)計(jì)上獨(dú)領(lǐng)風(fēng)騷的語言，都是有著完善的運(yùn)行時(shí)類型信息，就連lisp，其運(yùn)行時(shí)元數(shù)據(jù)也都很完備。靜態(tài)強(qiáng)類型語言（java、C#）與動(dòng)態(tài)語言比，顯然有著強(qiáng)大的靜態(tài)類型能力（這不是廢話嗎），能在編譯期就提前發(fā)現(xiàn)類型上的諸多錯(cuò)誤，但是也因此帶上靜態(tài)約束，導(dǎo)致呆板、繁瑣的代碼，java的繁文縟節(jié)，就是最好證明；而動(dòng)態(tài)語言恰好相反，代碼簡(jiǎn)潔，廢話少，但是喪失靜態(tài)信息，所謂重構(gòu)火葬場(chǎng)，那都是血和淚的教訓(xùn)。靜態(tài)語言與動(dòng)態(tài)語言真是一對(duì)冤家，如同光的波粒性，己之所長(zhǎng)恰是彼之所短，己之所短又是彼之所長(zhǎng)，魚與熊掌不可兼得。而C++竟然能集兩家之所長(zhǎng)，在靜態(tài)語言的領(lǐng)域中玩各種動(dòng)態(tài)行為藝術(shù)，比如動(dòng)態(tài)修改類型的反射信息，千奇百怪的花樣作死（喪心病狂的類型轉(zhuǎn)換）；在動(dòng)態(tài)范疇里面，又可以在編譯期榨取出來靜態(tài)類型信息，比如，消息發(fā)送的參數(shù)信息，想想win32的無類型的wparam和lparam，每次都要猿猴對(duì)照手冊(cè)解碼，從而最大限度地挖掘編譯器的最大潛力。所以說，c++是最強(qiáng)大的面向?qū)ο笳Z言，沒有之一。而把靜態(tài)和動(dòng)態(tài)融為一體之后，c++的抽象能力也到達(dá)一個(gè)全新的高度，自動(dòng)代碼生成，以后再發(fā)揮，這是一個(gè)龐大的課題。C++令人發(fā)指的強(qiáng)大，絕對(duì)遠(yuǎn)遠(yuǎn)超乎等閑猿猴的想象，特別是那批c with class的草覆蟲原始生物。C++只在部分函數(shù)領(lǐng)域的概念上表現(xiàn)令人不滿，比如lambda表達(dá)式的參數(shù)類型自動(dòng)推導(dǎo)，monad表達(dá)式，缺乏原生的延遲求值等。當(dāng)然，c++整個(gè)的設(shè)計(jì)理念非常繁雜隨心所欲，但是，卻可以在這一塊混沌里面整理出來一些舉世無雙的思想體系，就是說，c++是一大堆原材料，還有很多廚房用具，包括柴火，讓猿猴自行下廚，做出來的菜肴可以很難吃，也可以是滿漢全席，全看猿猴的手藝。

當(dāng)然，要在c++里頭搞面向?qū)ο螅嗬^承，虛繼承的那一套，必須徹底拋棄。最大的問題是，多繼承會(huì)導(dǎo)致混亂未知的二進(jìn)制內(nèi)存布局，虛函數(shù)表也一塌糊涂，十幾年前，c++設(shè)計(jì)新思維的基于policy的范式，雖然令人耳目一新，也因?yàn)檫@種范式下對(duì)象的內(nèi)存布局千奇百怪，所以，即便是最輕微的流行也沒有出現(xiàn)過。當(dāng)然，也不可能大規(guī)模搞消息發(fā)送這種很geek的套路，功能太泛化了，其實(shí)，消息發(fā)送就是動(dòng)態(tài)的給對(duì)象添加成員函數(shù)，并且可以在運(yùn)行時(shí)知道對(duì)象有多少成員函數(shù)，那個(gè)成員函數(shù)可以對(duì)該消息做出反應(yīng)，消息可以是字符串，整型ID（原子）， MFC的消息映射表(BEGIN_MESSAGE_MAP，…)就是一個(gè)功能嚴(yán)重縮水版的好例子，c++下支持消息映射的庫，絕對(duì)可以比破mfc的那一套要好上千百倍，不管是性能、類型安全、使用方便上。目前除了在gui這種變態(tài)的場(chǎng)合下才需要大搞消息發(fā)送，其他場(chǎng)景，完全可以說用不上，雖然說消息發(fā)送很強(qiáng)大很靈活，但也因?yàn)槠錃μ珔柡Γ炊由髦亍＿@好比goto，好比指針，好比stl的迭代器，什么都能做的意思，就是什么都盡量不讓它做。

那么，c++下搞面向?qū)ο螅€有什么法寶可用呢？當(dāng)然，在此之前，我們先要直面內(nèi)存分配。內(nèi)存既是c++的安身立命之本，又是c++淪落為落水狗喪家犬之幕后大黑手。假如不能為所欲為的操作內(nèi)存，那么c++的折騰法子，奇技淫巧，起碼要死掉一大半以上。而由于要支持各種花樣作死的內(nèi)存操作，c++的垃圾回收遲遲未曾出現(xiàn)，就連以巨硬之大能整出來的.net那么好的gc，霸王硬上弓，在給原生c++強(qiáng)硬加上托管功能（垃圾回收），都出力不討好。可見未來垃圾回收，對(duì)c++來說，嗯，想想就好了。內(nèi)存是資源，沒錯(cuò)，用raii來管理，也無可厚非。但是，內(nèi)存卻是一種很特殊的資源，1、內(nèi)存時(shí)對(duì)象的安身立命之所；2、不同于普通資源，內(nèi)存很多，不需要馬上用完就急急忙忙啟動(dòng)清理工作，只要系統(tǒng)還有大把空余的內(nèi)存，就算還有很多被浪費(fèi)了的內(nèi)存，都不要緊，gc也是因?yàn)檫@個(gè)原因才得以存在。相比內(nèi)存，普通資源給人的感覺就是數(shù)量及其有限，然后要提交工作結(jié)果，否則之前所做努力就廢了。所以，對(duì)于內(nèi)存，應(yīng)該也要特別對(duì)待。就算raii，也要采用專門的raii 。

假設(shè)我們的程序里面使用多種內(nèi)存分配器，比如說，每個(gè)線程都有自己專有的內(nèi)存allocator對(duì)象，然后，線程之間的共享數(shù)據(jù)由全局的內(nèi)存分配器分配，線程的內(nèi)部對(duì)象都用線程的專屬allocator來分配，那么，內(nèi)存分配器就是一個(gè)線程局部變量（tls，thread local storage）。于是，可以規(guī)定，所有的內(nèi)存分配都通過GetTlsAllocator()來new對(duì)象，當(dāng)然，確定是全局共享變量的話，沒辦法，就只能用GetGlobalAllocator()來new對(duì)象。那么，有理由相信，啟動(dòng)一個(gè)任務(wù)時(shí)，我們先定義一個(gè)arena allocator變量，并令其成為當(dāng)前線程的專屬內(nèi)存分配器，那么這個(gè)任務(wù)后面的所有new 出來的對(duì)象，包括循環(huán)引用，都不必關(guān)心。只要任務(wù)一結(jié)束，這個(gè)arena allocator變量一釋放，所有寄生在它身上的對(duì)象，全部也都消失得干干凈凈，沒有任何一點(diǎn)點(diǎn)的內(nèi)存泄露。就算任務(wù)內(nèi)部有大量的內(nèi)存泄露，那又如何，任務(wù)一結(jié)束，所有跟此任務(wù)有關(guān)的一切內(nèi)存，全部成塊清空。總之，不要以常規(guī)raii來解決內(nèi)存困境，解放思想，在內(nèi)存釋放上，我們可以有九種辦法讓它死，而不是僅僅靠shared_ptr，unique_ptr，weak_ptr這些狹隘的思維。

其次，完善的面向?qū)ο笤O(shè)計(jì)，避免不了完備的反射，用以在運(yùn)行時(shí)提供動(dòng)態(tài)類型信息，無參模板函數(shù)可以把靜態(tài)類型映射成全局唯一變量，好比，TypeOf<vector<int>>，返回vector<int>的全局唯一的const TypeInfo*對(duì)象，這個(gè)對(duì)象包含了vector<int>的所有靜態(tài)類型信息，可以這么說，在靜態(tài)類型層面上vector<int>所能做的任何事情，比如定義一個(gè)vector<int>的變量，也即是創(chuàng)建對(duì)象；遍歷、添加元素、析構(gòu)、復(fù)制賦值、元素?cái)?shù)量等等一切操作，與vector<int>對(duì)應(yīng)的TypeInfo對(duì)象，統(tǒng)統(tǒng)都可以做到。所不同的是，vector<int>的靜態(tài)類型代碼，只能用于vector<int>自身的情況（這樣子可放在源文件中），又或者是通過template，表現(xiàn)行為類似于vector<int>的數(shù)據(jù)類型（代碼必須在頭文件上）。而用TypeInfo*做的事情，全部都在運(yùn)行時(shí)發(fā)生，所有的靜態(tài)類型信息，全部被帶到運(yùn)行時(shí)來做，所以這些代碼全部都可以處在源文件里面，甚至動(dòng)態(tài)庫里頭，只不過是TypeInfo*操作的對(duì)象是一個(gè)二進(jìn)制內(nèi)存布局和vector<int>一模一樣的內(nèi)存塊，可以通過強(qiáng)制類型轉(zhuǎn)換，把運(yùn)行時(shí)的內(nèi)存塊轉(zhuǎn)換成靜態(tài)編譯時(shí)的vector<int>。其實(shí)這里的思想，就是想方設(shè)法將豐富多彩的靜態(tài)類型信息無損的保存到運(yùn)行時(shí)中，讓編譯時(shí)能做的事情，運(yùn)行時(shí)也可以做。差別在于，一個(gè)是用靜態(tài)類型信息來做事情，這里，任何一點(diǎn)點(diǎn)類型上的錯(cuò)誤，都會(huì)讓編譯器很不高興；一個(gè)則是用動(dòng)態(tài)類型信息來做事情，這里，顯然只能讓猿猴人肉編譯器。這里，可見動(dòng)態(tài)類型信息和靜態(tài)類型信息的表達(dá)能力是等價(jià)的，也即是同等重要性的意義，而靜態(tài)類型信息的意義有多大，相信大家都知道。

那么，如何建立完備的反射信息，這個(gè)必須只能用宏來配合完成，外部工具生成的反射信息代碼，功能很不完備，另外，c#、java等的反射信息全部都是編譯器生成的，可定制性很差。我們需要的是一點(diǎn)都不遜色于靜態(tài)行為的動(dòng)態(tài)行為。所以，只有由自己自行管理反射，才能做到真正意義上的完備反射。必要時(shí)，我們還可以在運(yùn)行時(shí)修改反射信息，從而動(dòng)態(tài)地增刪對(duì)象的行為方式，改變對(duì)象的面貌。看到這里，是否覺得很多的設(shè)計(jì)模式，在這里會(huì)有更清晰更簡(jiǎn)潔的表達(dá)方式呢，甚至，輕而易舉就可以出現(xiàn)新的設(shè)計(jì)模式。比如，以下定義對(duì)象反射信息的代碼。

在c++下，由于全局變量生命周期的隨意性（構(gòu)造函數(shù)調(diào)用順序不確定，析構(gòu)順序也不確定），大家都很忌諱其使用，雖然全局變量功能很強(qiáng)大，很多時(shí)候都避免不了。但是，標(biāo)準(zhǔn)上還是規(guī)定了全局變量的順序，所有的全局變量必須在main函數(shù)之前構(gòu)造完成，其析構(gòu)函數(shù)也只能在main函數(shù)結(jié)束后才調(diào)用。另外，函數(shù)的靜態(tài)變量必須在其第一次訪問之前構(gòu)造完整。基于這兩點(diǎn)，我們就可以在main函數(shù)之前構(gòu)建全部的反射信息，流程是這樣子，所有的類型的反射對(duì)象都是以函數(shù)內(nèi)部的靜態(tài)指針變量存在，他們都通過調(diào)用GetStaticAllocator()的內(nèi)存分配器來創(chuàng)建，這樣子，提供反射信息的函數(shù)，就避免了其內(nèi)部TypeInfo對(duì)象的析構(gòu)發(fā)生。最后，main結(jié)束后，由GetStaticAllocator()函數(shù)內(nèi)的內(nèi)存分配器的析構(gòu)函數(shù)統(tǒng)一釋放所有反射信息占用的內(nèi)存。最后，附上一個(gè)例子

    struct Student
    {
        //ClassCat表示為Student的基類，為空類，所以Student可以繼承它，但是代碼上又不需要明確繼承它，非侵入式的基類。
        //ClassCat提供二進(jìn)制序列化操作，xml序列化，json序列化，數(shù)據(jù)庫序列化等操作
        PPInlineClassTI(ClassCat, Student, ti)
        {
            PPReflAField(ti, name);
            PPReflAField(ti, age);
            PPReflAField(ti, sex, { kAttrXmlIgnore });    //表示不參與xml的序列化操作
        }
        AString name;
        int age;
        bool sex;
    };
    struct Config : Student
    {
        PPInlineClassTI(Student, Config, ti)
        {
            PPReflAField(ti, map);
        }
        HashMap<U8String, int> map;
    };

下期的主角是非侵入式接口，徹底替換c++上的多繼承，功能遠(yuǎn)遠(yuǎn)好過C#、java雜碎的弱雞接口，更超越狗語言的不知所謂的非侵入式接口。如果僅僅是完備的反射信息，而缺乏非侵入式接口，在c++下搞面向?qū)ο螅鋵?shí)還是很痛苦的。但是，有了非侵入式接口之后，一切豁然開朗。甚至可以說，感覺c++里面搞那么多玩意，都不過是為了給非侵入式接口造勢(shì)。然而非侵入式接口一直未曾正式誕生過。

posted @ 2017-07-11 11:56 華夏之火閱讀(1194) | 評(píng)論 (3) | 編輯收藏

2017年7月10日

stl的抽象缺陷終結(jié)

古龍說過，一個(gè)人的最大優(yōu)點(diǎn)往往將是其致命的弱點(diǎn)。這句話用在stl的迭代器上，最是合適不過。stl通過迭代器來解耦容器與算法，可謂擊節(jié)贊嘆；但是，讓迭代器滿世界的到處亂跑，未免就大煞風(fēng)景。此話怎講？

其實(shí)，有些語言就沒有迭代器的概念，并且還活得很優(yōu)雅，好比haskell的list啊、tree啊，壓根就不需要什么迭代器，只需要模式匹配，體現(xiàn)其數(shù)據(jù)結(jié)構(gòu)的遞歸特點(diǎn)，就可以很優(yōu)雅地表達(dá)算法。就是java、c#、C++這幾個(gè)破面向?qū)ο笳Z言，才需要大用特用迭代器，沒有迭代器就活不下去了。迭代器的出現(xiàn)就是為了彌補(bǔ)其語言喪失清晰表達(dá)遞歸數(shù)據(jù)結(jié)構(gòu)的能力。看到haskell的list到c++的stl下的對(duì)應(yīng)樣子，很多人都表示很難過，因?yàn)?/span>stl里面，list根本就沒有tail函數(shù)，更逞論支持list的tail還是一個(gè)list這樣絕妙的idea。一切必須通過迭代器這個(gè)萬金油來糊弄其尷尬的困境。

隨便來看看幾行stl算法函數(shù)的代碼

Vector<int> nums = {..};
find(nums.begin(), nums.end(), 2);
remove_if(nums.begin(), nums.end(), _1 >= 0); //為了省事，用了bll的風(fēng)格，在c++11中，要從零開始造一個(gè)bll風(fēng)格的輪子，不能更方便，大概也就兩三百行的代碼

看到?jīng)]有，你信不信，隨便統(tǒng)計(jì)一下，一打的algorithm函數(shù)，起碼就有12個(gè)函數(shù)的調(diào)用之道，必須傳遞container.begin()，container.end()。begin和end這對(duì)兄弟，總是成雙成對(duì)的出現(xiàn)，說明了一件事情，就是從一開始，它們必須被打包在一起，而不應(yīng)該硬生生地將它們拆開。知道這一拆開，帶來多少問題嗎？代碼上的累贅還算是小事，比如，簡(jiǎn)潔清晰流暢的find(nums, 2)，卻要生硬的寫成find(nums.begin(), nums.end(), 2)。當(dāng)然，這種api設(shè)計(jì)，也并非一無是處，起碼，在表達(dá)容器里面的部分區(qū)間時(shí)，很方便，好比下面的代碼

int nums[10] = {…};

find(nums+1, end(nums)-1, 2);

看起來，好像的確挺方便的，將begin、end放在一起，要表達(dá)這樣的概念，似乎就有些麻煩，但其實(shí)，這是假象，當(dāng)角度變換時(shí)，我們可以會(huì)有更方便的方式來表達(dá)這樣的需求。最起碼，容器的部分區(qū)間也應(yīng)該是由容器本身來表達(dá)，而不應(yīng)轉(zhuǎn)嫁給迭代器來應(yīng)付，數(shù)組的部分也是數(shù)組，樹的分支也是樹，這樣的概念，就應(yīng)該由容器本身來定義。像是哈希表就不支持部分區(qū)間的概念。

為何algorithm的算法，全部（不是基本）都要求一對(duì)迭代器。那是因?yàn)檫@些算法的輸入對(duì)象，本來就是一個(gè)數(shù)據(jù)集合。而一個(gè)迭代器無法完整地表達(dá)一個(gè)容器，起碼必須一對(duì)迭代器才能完整地表達(dá)一個(gè)數(shù)據(jù)集。但是，用一對(duì)迭代器來作為入?yún)ⅲ陀靡粋€(gè)區(qū)間作為入?yún)ⅲw現(xiàn)抽象的側(cè)重點(diǎn)完全不同，而由于此種不同，最后的演變結(jié)果，也是天淵之別，即是一對(duì)迭代器設(shè)計(jì)思路是淵，自然，而區(qū)間的設(shè)計(jì)方案，顯然是天。

再次回顧上文的結(jié)尾，find，find_if，remove, remove_copy, remove_copy_if, remove_if,……，有沒有感受，一股濃濃的過程式風(fēng)格，十分的笨重，明顯的非正交，濃烈的c語言風(fēng)格。對(duì)于這樣的api，讓本座對(duì)委員會(huì)的那幫老不死，徹底的絕望了。他們（它們）的審美觀，停留在很低很低的層次上。

將begin，end拆分開來的最大問題，其實(shí)也就只是，前一個(gè)函數(shù)的處理結(jié)果，不能平滑的傳遞到下一個(gè)函數(shù)里面去。比如說，現(xiàn)在函數(shù)make_nums返回vector<int>，試比較一下，高下立判。

auto nums = make_nums();
find(nums.begin(), nums.end(), 2); //一對(duì)迭代器作為入?yún)?/span>
find(make_nums(), 2);//直接數(shù)據(jù)區(qū)間作為入?yún)?/span>

說了這么多，我們強(qiáng)烈要求的僅僅是函數(shù)風(fēng)格的api，正交式的函數(shù)設(shè)計(jì)，前一個(gè)函數(shù)的處理結(jié)果可以平滑地傳遞給下一個(gè)函數(shù)。總結(jié)algorithm的一坨函數(shù)，本質(zhì)上只需filter，fold，map，insert(copy)這屈指可數(shù)的幾個(gè)函數(shù)就可以自由地組合出來，并且還能組合出來algorithm上沒有的效果。首先，這幾個(gè)函數(shù)的返回結(jié)果都是數(shù)據(jù)區(qū)的數(shù)據(jù)對(duì)象(里面有begin和end的成員函數(shù)，用以返回迭代器)。其次，就是在迭代器上面做文章，以支持filter、map等操作，也就是在*、++、!=這幾個(gè)運(yùn)算符上做花樣，要達(dá)到filter、map的效果，很容易的。至于像是要求隨機(jī)訪問迭代器概念的函數(shù)，太常用的就做到array_view里面好了，或者就明確規(guī)定入?yún)⒕褪?/span>array_view。

然后stl里面還臆造了一種好像叫做insert_iterator迭代器類型的適配器，用以通過迭代器的語法往容器里頭插入數(shù)據(jù)，好像很玄妙，實(shí)則就是強(qiáng)行拔高迭代器的用途，完全就違背了迭代器出現(xiàn)的初衷。這種扭曲的想法，完全就是上面那一坨病態(tài)api的產(chǎn)物。所以，原本的api設(shè)計(jì)，算法函數(shù)必須以容器（數(shù)據(jù)區(qū)間）為入?yún)ⅲ瑑?nèi)部調(diào)用其begin和end成員函數(shù)獲得迭代器來遍歷容器的函數(shù)，何其清晰的設(shè)計(jì)思路。但是，stl的設(shè)計(jì)思路，導(dǎo)致迭代器泛濫，甚至連客戶層面的代碼也大把大把的迭代器，于是迭代器的問題就接二連三的產(chǎn)生，什么失效啊，什么first和last匹對(duì)錯(cuò)誤。還有，導(dǎo)致容器里面的關(guān)于迭代器的成員函數(shù)多了一倍，哈希表里面也沒有類似于C#里Dictionary的Keys和Values屬性函數(shù)，這些用起來很方便的，不是嗎？

stl的這種api設(shè)計(jì)思路完全不是以方便使用為主，而是以滿足自己的獨(dú)特口味為目的。看看find函數(shù)，它返回一個(gè)迭代器，所以，我們使用時(shí)，必須通過用end來判斷要找的東西是否在區(qū)間里面，

auto found = find(nums.begin(), nums.end(), 2);

if (found != nums.end()){…}

依本座看，直接就返回指針好了，指針為nullptr，就表示元素找不到，代碼變成這樣

if (auto found = find(nums, 2)){…}

代碼合并成一行，不用再和end比較了。更重要的是，返回結(jié)果就是指針，類型非常明確，可以平滑的傳遞到別的函數(shù)里；而不是迭代器類型，誰知道迭代器類型是什么類型。template這種東西的類型，能明確下來時(shí)，就盡快明確下來。至于說，有些區(qū)間的元素不支持返回地址，好比，vector<bool>，很簡(jiǎn)單，那就不支持好了。本座編寫c++代碼的原則之一，不求大而全，需求專一，絕不會(huì)因?yàn)閭€(gè)別同學(xué)，就犧牲大多數(shù)情況下清晰方便高效的api風(fēng)格。對(duì)于這些異數(shù)，必要時(shí)，用奇技淫巧解決。你知道，因?yàn)槎嗬^承，虛繼承，把成員函數(shù)指針這個(gè)簡(jiǎn)潔的概念搞得非常復(fù)雜，不能按正常人方式來使用了，嚴(yán)重影響成員函數(shù)的用范圍，一直讓本座耿耿于懷。其實(shí)，95%以上的情況下，我們就僅僅需要普通成員函數(shù)指針而已，另外的5%，也都可以用普通成員函數(shù)來封裝。所以，為了彌補(bǔ)這個(gè)遺憾，本座做了一個(gè)精簡(jiǎn)版的delegate，只接受全局函數(shù)和普通成員函數(shù)，當(dāng)字段object為空，就表示字段函數(shù)指針是全局函數(shù)，不為空，就表示函數(shù)指針是成員函數(shù)。至于其他一切奇奇怪怪的函數(shù)，本座的這個(gè)delegate就say no，明確拒絕。

stl的這種獨(dú)特到處都是，boost更是將其發(fā)揚(yáng)光大，反正設(shè)計(jì)出來的api，就是不考慮讓你用的舒爽，二進(jìn)制的布局，更加一塌糊涂。比如，any的使用，是這樣子用的，cout << any_cast<int>(anyValue)，這里還好，假如要分別針對(duì)any的實(shí)際類型來寫代碼，必須這樣子：

if(anyValue.type() == typeid(int))
cout << any_cast<int>(anyValue);
else if (anyValue.type() == typeid(double))
cout << any_cast< double >(anyValue);
…

這種對(duì)類型安全無理取鬧的強(qiáng)調(diào)，讓人火冒三丈。要本座說，直接在any里面添加Cast模板成員函數(shù)，結(jié)果就返回指針好了，指針為空，就表示類型不匹配，代碼就變成這樣

if(auto value = anyValue.Cast<int>())
cout << *value;
else if(auto value = anyValue.Cast< double >())
cout << *value;
…

是否就沒那么心煩呢。另外，鑒于stl對(duì)于反射的拒絕，采用virtual+template的類型拭擦大法來彌補(bǔ)，其實(shí)并不怎么完美。本座用反射重新實(shí)現(xiàn)的any，比stl的any好多了，不管是性能、編譯速度、使用方便上，都是要好太多。還有，stl的any，要為每個(gè)用到的類型都要生成一個(gè)實(shí)實(shí)在在的多態(tài)具體類，每個(gè)類都要有一個(gè)專門的虛函數(shù)表對(duì)應(yīng)，這些可都要寫到二進(jìn)制文件里面，代碼就是這樣膨脹起來的。總之，stl回避反射后，反射就以另一種形式回歸，好比virtual+template，好比%d、%s，好比locale的那些facet實(shí)現(xiàn)，這些動(dòng)態(tài)機(jī)制各自為政，各種混亂。還不如干脆就從源頭上系統(tǒng)化公理化地給予終極解決。

所以，總體上感受stl設(shè)計(jì)思路上存在的路線，就是太在意于c++語言本身上的特點(diǎn)，受語言自身的缺陷復(fù)雜影響太多，忽略了真正的需求，太多的臆造需求，強(qiáng)行讓需求來遷就語言，而不是讓語言來配合基礎(chǔ)庫的實(shí)際普遍需求，需求才是根本，為了可以最方便，最清晰，最性能的基礎(chǔ)庫，完全可以大規(guī)模地使用宏、挖掘語言里面最黑暗的邊角料，甚至為了庫的清晰性，可以拒絕那些用了復(fù)雜特性的數(shù)據(jù)結(jié)構(gòu)，比如多繼承，虛繼承等無聊玩意。

概括起來，路線問題導(dǎo)致最終的正果，也即是stl的具體弱雞表現(xiàn)就是，最根本是二進(jìn)制接口使用上的重重阻礙，誰敢在動(dòng)態(tài)庫api使用stl的數(shù)據(jù)類型。其次是以下5小點(diǎn)：

1、內(nèi)存分配器不應(yīng)該是容器的模板參數(shù)，對(duì)allocator的處理太過草率，當(dāng)初這里必須做深入的挖掘，c++完全可以實(shí)現(xiàn)一定程度上的垃圾回收功能，比如arean allocator，不必一一回收在arena allocator上分配的對(duì)象，只需一次性釋放arena allocator的內(nèi)存，達(dá)到多次分配，一次釋放的高性能效果，還避免內(nèi)存泄露，也不用直接面對(duì)循環(huán)引用的怪胎設(shè)計(jì)問題。現(xiàn)有的內(nèi)存管理策略，把壓力都放在智能指針上；

2、提供的通用容器不夠完備；原本stl的數(shù)據(jù)結(jié)構(gòu)就大可滿足所有正常和非正常的使用場(chǎng)合，比如滿足侵入式的鏈表需求，比如不管理元素生命周期的容器等；

3、過多的暴露迭代器，迭代器的應(yīng)用范圍過廣，stl的算法函數(shù)用起來很不方便；

4、回避動(dòng)態(tài)類型反射信息，對(duì)數(shù)據(jù)的輸入輸出支持非常單薄，包括字符串處理、文件讀寫、網(wǎng)絡(luò)數(shù)據(jù)收發(fā)等，標(biāo)準(zhǔn)庫上的現(xiàn)有那點(diǎn)小功能，僅僅是聊勝于無而已，難堪大任；

5、非容器系的實(shí)用類太少；

一句話，目前stl的使用，還是遠(yuǎn)遠(yuǎn)不夠爽。原本用上stl的代碼，應(yīng)該可以更短、更快、更小。只可惜，stl在通過迭代器實(shí)現(xiàn)算法與容器的分離之后，就停步不前，其設(shè)計(jì)體系在別的地方，鮮有建樹創(chuàng)新。戰(zhàn)略高度過于局促，很多復(fù)雜難搞的問題，其實(shí)都蘊(yùn)含著絕大的機(jī)遇，而stl都一一回避，真是回避得好！

posted @ 2017-07-10 18:30 華夏之火閱讀(988) | 評(píng)論 (0) | 編輯收藏

僅列出標(biāo)題下一頁

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

huaxiazhihuo

string類的設(shè)計(jì)

U8String的重構(gòu)體會(huì)

私有繼承小討論

回顧C(jī)++

C++的非侵入式接口

再論接口

c++面向?qū)ο蟮念愒O(shè)計(jì)

c++的面向?qū)ο笾皞?/a>

再議c++的面向?qū)ο竽芰χ?/a>

stl的抽象缺陷終結(jié)

導(dǎo)航

統(tǒng)計(jì)

常用鏈接

留言簿(6)

隨筆分類

隨筆檔案

搜索

積分與排名

最新評(píng)論

閱讀排行榜

評(píng)論排行榜