• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>

            歲月流轉,往昔空明

            C++博客 首頁 新隨筆 聯系 聚合 管理
              118 Posts :: 3 Stories :: 413 Comments :: 0 Trackbacks

            在設計一門語言與其他語言交互的API與ABI(Application Binary Interface,二進制接口)時,調用協議和內存對齊是兩個無從回避的問題。

            本文將討論如何在LLVM上生成正確的內存對齊和調用協議的代碼。

            在這里為了方便和標準起見,假定應用LLVM的語言的Extending和Embedding的對象都是C。

            調用協議

            先來討論調用協議。調用協議用于保證調用方和被調用方在二進制/匯編一級上是相容的。合適的調用協議可以幫助構造出以下代碼:

            // Callee Signature of LLVM code
            void __cdecl foo( int a, float b, float4 c);
            
            // C caller
            typedef void (__cdecl* fn_ptr)(int, float, float4)
            fn_ptr p = static_cast<fn_ptr>( get_jit_function("foo") );
            p(1, 1.0, vec);
            

            一般來說調用協議包括參數傳遞和返回值傳遞和堆棧平衡三個部分。在x86平臺上的C/C++編譯器中常見的調用協議有cdecl, fastcall和stdcall。具體的協議內容請參見MSDN。

            在C++中還有一類特殊的調用協議thiscall,用于調用對象的成員函數。但是這一類調用協議不同的平臺,不同的編譯器實現皆有不同,既無書面標準,也無事實標準,再加上virtual call等復雜的情況存在,并不適合用于做跨語言的調用。

            對于x64平臺而言,在windows下和linux下分別有兩種調用協議。

            先來看x86。由于x86在cdecl和fastcall上是有著跨平臺的標準的,因此LLVM對它的支持是比較完整的。程序只要在創建Function的時候指定Call Convention即可。

            但是對于x64,LLVM的支持便不是那么完善。以windows為例,windows的x64調用協議要求以rcx,rdx,r8,r9寄存器傳遞前四個不大于64bit的參數,其余參數放在棧上。如果參數大于64bit,則要求傳遞它的指針。浮點使用xmm0-3來傳遞。但是對于LLVM而言,一旦參數大于64bit,它便會將整個對象而不是指針壓到棧上傳遞。因此在遇到x64時,需要小心處理API部分的調用協議。

            在這里,我們需要將所有超過64bit的結構體處理成指針(或者拷貝后處理成指針)傳遞。

            同時,LLVM提供了readonly和byval兩個參數屬性(Attribute)來確保參數的值語義。前者意味著傳入的指針所指向的值是不被修改的,(類似于T const*),而后者會對傳入的指針做一份內存拷貝,確保寫值不被傳遞出函數(類似于值拷貝)。這樣,LLVM生成的函數便可以MSVC生成的x64代碼正確調用了。

            內存對齊

            與移動平臺的體系結構相比,x86對內存對齊的條件算是相當寬松的了。大部分的指令對內存對齊基本上是沒有特殊要求的。只有一些SIMD的指令會對內存對齊有所限定,例如movaps。

            為了方便后端生成SIMD代碼,LLVM提供了vector類型,例如vector<float, 1>。在代碼生成的時候,vector會編譯成最有可能的SIMD類型。因此在x86平臺上,vector<float, 1-4>都被處理成類似于__m128的類型,更長的vector則被拆分成多個__m128類型。

            這實際上意味著,所有的vector都應該遵循16Bytes對齊的原則。

            考慮到我們的需求,類似于struct{ float[3]; }這樣的結構,如果能表示為vector<float, 3>顯然適合一些數學運算,例如shuffle,逐元素的add,sub,mul,同時LLVM指令的選擇也更加靈活。但是顯然,這個結構體有兩個條件是不滿足的:16字節對齊和16字節的大小(movups和movaps都是一次取16字節)。這會造成邊界下讀寫的內存越界。因此非常可惜,這些數據必須表示為struct{ float ,float, float }。在讀取的時候,也會生成正確的指令:movss。

            那么,對于一般的非對齊的vec4應用vector<float,4>行不行呢?

            答案是,很困難。對于LLVM而言,他們在設計的時候就沒有過多的考慮vector在非對齊時候的應用。盡管load和store都能夠指定alignment以生成非對齊的內存操作(例如movups)并且確實會起效,但是由于代碼優化、臨時存取等特性的存在,導致一些非load和store的內存操作仍然是要求對齊的(例如生成了addaps xmm, [addr])。此時仍然有可能為非對齊的數據生成了內存對齊的指令。

            因此綜合權衡,SASL在API界面上使用了struct{float x,y,z,w;} 這樣的ABI來表示數據,在代碼生成時,會首先將struct的數據轉換成vector,然后再執行其它的操作,兼顧ABI與SIMD;同時對于Intrinsic,由于并不暴露給Host,所以它們仍然盡可能使用Vector,便于LLVM進行優化。

            posted on 2011-08-17 13:58 空明流轉 閱讀(3436) 評論(3)  編輯 收藏 引用

            評論

            # re: LLVM的調用協議與內存對齊 2011-08-17 16:38 陳梓瀚(vczh)
            好復雜啊  回復  更多評論
              

            # re: LLVM的調用協議與內存對齊 2011-08-18 00:36 ooseven
            期待空轉兄的大作,希望做成一個系列。  回復  更多評論
              

            # re: LLVM的調用協議與內存對齊 2014-04-03 09:56 往往
            在建立扎實收入之前的那種開支需求的一種保障在生活,保障在房租,保障在零用之間建立起來的三個基本的扎實收入的過程當中所需要的一種付出其中的基本的一個事實的努力的參考的基本含量在于確定起來的是基于一個現實的暫時的扎實的基礎收入建立起來對于溝通模式暢通的一個局面上面建立起來的扎實收入的基本面,這樣的一個基本面不是說自己具備的這樣的一種自我意識的過程當中來尋找這樣的一個扎實基礎收入的可能,而是一定需要建立這樣扎實收入的基本面,在這個之前付出就需要更加斟酌的保持其中的一個安全的自我層面來考量。  回復  更多評論
              

            精品久久久无码人妻中文字幕豆芽| 久久亚洲高清综合| 91精品国产91久久久久福利| 精品久久8x国产免费观看| 久久精品中文字幕久久| 久久久免费观成人影院| 伊人久久久AV老熟妇色| 国产精品日韩深夜福利久久| 一本久道久久综合狠狠躁AV| 久久99精品久久久久久| 久久久久久亚洲精品不卡| 精品国产一区二区三区久久久狼| 国产精品美女久久久久AV福利 | 色综合久久天天综线观看| 久久亚洲精品成人av无码网站| 国产精品gz久久久| 欧美精品久久久久久久自慰| 国产精自产拍久久久久久蜜| 日韩乱码人妻无码中文字幕久久| 久久AAAA片一区二区| 久久青青草原精品国产| 久久久久无码精品| 人人狠狠综合久久亚洲婷婷| 色老头网站久久网| 99久久综合国产精品二区| …久久精品99久久香蕉国产| 久久亚洲美女精品国产精品| 国产激情久久久久影院| 日韩精品久久久久久久电影蜜臀| 久久精品中文字幕有码| 久久精品国产亚洲欧美| 精品久久久久久久久午夜福利| 无码乱码观看精品久久| 国产高潮国产高潮久久久91| 精品久久久噜噜噜久久久| 久久99国产综合精品女同| 久久久久久久91精品免费观看| 久久国产成人亚洲精品影院| 国产视频久久| 国产亚州精品女人久久久久久 | 国产精品久久久久9999高清|