• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 9,  comments - 19,  trackbacks - 0
            本人博客地址:http://www.shnenglu.com/pwq1989/

            上一篇對Luajit的代碼結構和編譯過程做了簡單的描述,這一篇就講一下buildvm在第一步預處理dasc文件的過程和DynASM這個輪子。

            官方連接:http://luajit.org/dynasm.html

            是為了讓你更優雅的C里面擼匯編的一個工具,我記得以前看過一個老外的blog對比過同樣功能的jit code generator的語法,Luajit的作者顯然品位還是很高的。

            我們先來看看如果不用工具硬生生擼代碼的話會發生什么。
            1、你往一段內存里面寫0xB8,0x00,0x01....
            2、你在文件里定義好多label,寫個copy section的宏往內存里面復制,你還不能確定里面到底是什么。(哦。。這個的術語叫Threaded。。。)

            然后再對比下AsmJit或者Xbyak的例子看看(他們的功能差不多),DynASM還提供了.marco實現,就會發現語法真是sweeeet~

            這是我寫著玩的一個草泥馬語jit解釋器(https://github.com/pwq1989/GMHjit)語法真是清新自然啊,如果你想看工業級的應用,可以看看Google的Haberman寫的protobuf的upb庫,里面用DynASM進行了jit,號稱快了多少多少(不去考證了),或者是agentzh寫的sregex正則庫,也是用它做了jit。一般來說DSL配上jit的話一定會快很多就錯不了了。

            下面給一個DynASM的Demo程序(摘抄自這個blog
             1 // DynASM directives.
             2 |.arch x64
             3 |.actionlist actions
             4  
             5 // This define affects "|" DynASM lines.  "Dst" must
             6 // resolve to a dasm_State** that points to a dasm_State*.
             7 #define Dst &state
             8  
             9 int main(int argc, char *argv[]) {
            10   if (argc < 2) {
            11     fprintf(stderr, "Usage: jit1 <integer>\n");
            12     return 1;
            13   }
            14  
            15   int num = atoi(argv[1]);
            16   dasm_State *state;
            17   initjit(&state, actions);
            18  
            19   // Generate the code.  Each line appends to a buffer in
            20   // "state", but the code in this buffer is not fully linked
            21   // yet because labels can be referenced before they are
            22   // defined.
            23   //
            24   // The run-time value of C variable "num" is substituted
            25   // into the immediate value of the instruction.
            26   |  mov eax, num
            27   |  ret
            28  
            29   // Link the code and write it to executable memory.
            30   int (*fptr)() = jitcode(&state);
            31  
            32   // Call the JIT-ted function.
            33   int ret = fptr();
            34   assert(num == ret);
            35  
            36   // Free the machine code.
            37   free_jitcode(fptr);
            38  
            39   return ret;
            40 }

            預處理之后那就會變成這樣子:
             1 //|.arch x64
             2 //|.actionlist actions
             3 static const unsigned char actions[4] = {
             4   184,237,195,255
             5 };
             6  
             7 // []
             8  
             9 //|  mov eax, num
            10 //|  ret
            11 dasm_put(Dst, 0, num);
            dasm_put就是把num參數和actions[]一起放入了Dst(#define Dst &state)的制定的內存中,這時候已經是機器碼的形式了。
            下面是對于acitons[]數組內容的解釋:
            184(B8)-- mov eax, [immediate] 指令的第一個字節
            237       -- 內置的標志DASM_IMM_D, 指明應該放入一個4字節寬度的參數,與上一條指令完成一個MOV
            195(C3)-- 對應ret指令
            255       -- 內置的標志DASM_STOP

            以上就是最簡單的例子,dasm_growpc()是內置的函數,用來增長maxpc, 這樣在程序里面就可以方便寫出jmp => label 這樣的指令了。

            由于DynASM的文檔很少,幸虧還有幾個例子,除了例子唯一能看的就是源碼了,所以在用的時候出現問題是很痛苦的。。當時寫GMHjit就發現了蛋疼的pre-process period bug,后來繞過去了。

            源碼文件有這么幾個
            -- dynasm.lua
            -- dynasm_proto.h
            -- dynasm_*.lua
            -- dynasm_*.h  // * x64  x86  ppc mips arm 等target

            用起來就是lua dynasm.lua a.dasm > a.h 

            下面就從dynasm.lua開始分析下他的源碼

            入口是parseargs函數,里面給的g_opt參數賦默認的值,一個repeat 中調用parseopt解析參數,opt_map就是option對args的函數映射。

            函數wline,wcomment,wsync,wdumplines都是對輸出的目標文件的操作。

            真正的主函數是 translate,把input file變成 output file,在readfile中的doline函數是真正的處理過程,里面判斷是否是Assembler line之后Emit C code,調用dostmt(aline)。里面繼續有map_coreop[*]來處理section macro arch nop_ error_1 include  if endif elseif 等關鍵字,想深入研究的可以自己去看,其中在loadarch中根據arch加載不同的lua庫

            如果arch是x64的話,本質還是require x86
            來看dasm_x86.lua文件

            _M.mergemaps這是關鍵的方法,設置了2個Map的元方法,然后返回,相當于是把方法綁定在table里面傳遞了出去。處理后文件中關鍵的actionlist[]數組和Dasm_put(Dst, ...)的輸出就是這個lua文件的方法。
            里面提供了很多dump方法,可以供我們遇到問題時候調試處理過程。

            action_names就是以后生成的action_list中的內置標志定義,必須與dasm_x86.h中的enum定義一致。
            表明了代表的參數和長度等信息。
            這個文件里面所有的函數就是做了一件事,把你的 |...  這樣子的代碼處理成數組輸出到目標文件中(我是匯編渣渣,里面貌似支持SSE2、3、4+,看不懂,等到以后看到traced jit的時候再去翻手冊把)

            預處理完成之后,就是#include "dasm_x86.h",里面有最關鍵的dasm_State結構體的定義,幾乎里面所有的函數都是對外的API,有init,setup,free等等,除去初始化與free之外,有三個步驟是需要出現在你都代碼中:
            1、dasm_put(Dst,...) 這個是自動生成的,不用我們操心,根據actionlist[]和運行時的參數寫入到Dst指定的內存(Dst->section)中.
            2、dasm_link() 第二個參數是返回的代碼長度大小,這個函數把section合并到一起,處理偏移等等。
            3、dasm_encode() 第二個參數是一個接受encode輸出的buffer指針。

            然后就可以用一個函數指針,比如聲明一個 int (*f)(*int), int ret = f(param) 直接運行剛剛生成的機器碼了。






            posted on 2013-11-30 12:49 右席 閱讀(7192) 評論(0)  編輯 收藏 引用 所屬分類: Luajit
            国产精品久久久久a影院| 久久免费视频网站| 色天使久久综合网天天| 久久夜色精品国产亚洲| 亚洲乱码中文字幕久久孕妇黑人| 99麻豆久久久国产精品免费 | 99久久做夜夜爱天天做精品| 久久久久亚洲AV无码观看| 久久99国内精品自在现线| 精品人妻伦九区久久AAA片69| 久久久久国产精品嫩草影院| 久久香蕉综合色一综合色88| 久久久久久久波多野结衣高潮 | 伊人久久大香线蕉亚洲五月天| 国产精品久久久亚洲| 欧美精品国产综合久久| 久久国产成人| 久久精品国产网红主播| 亚洲欧美精品一区久久中文字幕 | 热99RE久久精品这里都是精品免费| 久久精品麻豆日日躁夜夜躁| 亚洲精品无码专区久久同性男| 丁香五月网久久综合| 新狼窝色AV性久久久久久| 国产午夜福利精品久久| 久久免费小视频| 99热成人精品热久久669| 性做久久久久久久| 一本久道久久综合狠狠爱| 久久久久精品国产亚洲AV无码| 久久最新免费视频| 欧美激情精品久久久久久久九九九| 久久国产乱子精品免费女| 精品久久香蕉国产线看观看亚洲| 亚洲午夜久久久久久噜噜噜| 亚洲av伊人久久综合密臀性色| 亚洲精品无码久久久久久| 久久精品国产亚洲AV嫖农村妇女| 色偷偷88888欧美精品久久久| 日日躁夜夜躁狠狠久久AV| 俺来也俺去啦久久综合网|