今天開始學習linux內核編程了,從沒有內核編程基礎開始學起。所以很多相關的知識都要了解。首先就是AT&T匯編語言。因為在linux內核源代碼中,好像除了開始的bootsect.s和head.s是用intel的匯編外,別的匯編代碼都是用的AT&T匯編語言,所以有必要把AT&T匯編語言了解一下。
不過,由于AT&T匯編和intel匯編大同小異,所以,了解一下一些不同的地方就可以了。
以下的內容都是AT&T匯編的特點:
1、寄存器前面要加“%”,如 mov %eax,%ebx
這里要注意的一點是,AT&T匯編中,源寄存器和目的寄存器的順序和intel匯編剛好相反,AT&T匯編中,左邊的是源寄存器,右邊的是目的寄存器,在上邊那個例子中,%eax是源寄存器,%ebx是目的寄存器。
2、立即數/常數前面要加$,如 mov $4,%ebx 把4這個數裝入ebx這個寄存器。
符號常數直接用, 如 mov value,%eax 即把value代表的那個值裝入eax寄存器。
mov $value,%eax 即把value的值作為地址,而把對應那個地址中的值裝入eax。
3、b(byte):8位, w(word):16位, l(long):32位
如: movb %al,%bl movw %ax,%bx movl %eax,%ebx
4、jum/call的操作數前要加上“*"作為前綴, 遠跳轉ljmp,遠調用lcall
如 ljmp $section,$offset
lcall $section,$offset
這里$section和offset表示的就是,以section為段地址,offset為段內偏移地址。因此,ljmp $section,$offset即跳轉到section:offset地址。
5、遠返回lret
如 lret $stack_adjust
6、尋址方式
寄存器間接尋址 AT&T: (%eax) Intel: [eax]
表示方式 section:disp(base,index,scale)
計算方法 base+index*scale+disp
即 section:[base+index*scale+disp]
其中disp是表示偏移地址。
如 movl -4(%ebp),%eax 把[%ebp-4]的內容裝入eax
變址尋址 AT&T: _variable(%eax) Intel: [eax + _variable]
AT&T: _array(,%eax,4) Intel: [eax*4 + _array]
AT&T: _array(%ebx,%eax,8) Intel: [ebx + eax*8 + _array]
7、C語言中嵌入匯編
格式: _asm_("asm statements":outputs:inputs:registers-modified)
其中,"asm statements"是匯編語句表達式,outputs,inputs,register-modified都是可選參數,以冒號隔開,且一次以0~9編號,如outputs的寄存器是0號,inputs寄存器是1號,往后依次類推。outputs是匯編語句執行完后輸出到的寄存器,inputs是輸入到某個寄存器。
例1:_asm_("pushl %%eax\n\t" "movl $0,%%eax\n\t" "popl %%eax");
在嵌入匯編中,寄存器前面要加兩個%,因為gcc在編譯是,會先去掉一個%再輸出成匯編格式。
例2:{ register char _res;\
asm("push %%fs\n\t"
"movw %%ax,%%fs\n\t"
"movb %%fs:%1,%%al\n\t"
"pop %%fs"
:"=a"(_res):"0"(seg),"m"(*(addr)));\
_res;}
movb %%fs:%1,%%al\n\t一句中是把以fs為段地址,以后面的第二號寄存器即后面的seg中的值為偏移地址所對應的值裝入al。"=a"(_res):"0"(seg),"m"(*(addr)))一句中,"=a"(_res)表示把a寄存器中的內容給_res,"0"(seg)表示把seg中的內容給0所對應的寄存器,而0即表示使用和前一個寄存器相同的寄存器,這里即使用a寄存器,也就是說把seg中的內容個a寄存器。
需要解釋以下的是,a,b,c,d分別表示寄存器eax,ebx,ecx,edx
S,D分別表示寄存器esi,edi
r表示任意寄存器
0(數字0,不是o!)表示使用上一個寄存器