Panda

<

2025年9月

>

日

一

二

三

四

五

六

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

11

統(tǒng)計(jì)

隨筆 - 21
文章 - 0
評(píng)論 - 2
引用 - 0

常用鏈接

留言簿

隨筆分類(lèi)

隨筆檔案

搜索

閱讀排行榜

評(píng)論排行榜

Linux 中 x86 的內(nèi)聯(lián)匯編

如果您是 Linux 內(nèi)核的開(kāi)發(fā)人員，您會(huì)發(fā)現(xiàn)自己經(jīng)常要對(duì)與體系結(jié)構(gòu)高度相關(guān)的功能進(jìn)行編碼或優(yōu)化代碼路徑。您很可能是通過(guò)將匯編語(yǔ)言指令插入到 C 語(yǔ)句的中間（又稱為內(nèi)聯(lián)匯編的一種方法）來(lái)執(zhí)行這些任務(wù)的。讓我們看一下 Linux 中內(nèi)聯(lián)匯編的特定用法。（我們將討論限制在 IA32 匯編。）

GNU 匯編程序簡(jiǎn)述

讓我們首先看一下 Linux 中使用的基本匯編程序語(yǔ)法。GCC（用于 Linux 的 GNU C 編譯器）使用 AT&T 匯編語(yǔ)法。下面列出了這種語(yǔ)法的一些基本規(guī)則。（該列表肯定不完整；只包括了與內(nèi)聯(lián)匯編相關(guān)的那些規(guī)則。）

寄存器命名
寄存器名稱有 % 前綴。即，如果必須使用 eax，它應(yīng)該用作 %eax。

源操作數(shù)和目的操作數(shù)的順序
在所有指令中，先是源操作數(shù)，然后才是目的操作數(shù)。這與將源操作數(shù)放在目的操作數(shù)之后的 Intel 語(yǔ)法不同。

mov %eax, %ebx, transfers the contents of eax to ebx.

操作數(shù)大小
根據(jù)操作數(shù)是字節(jié) (byte)、字 (word) 還是長(zhǎng)型 (long)，指令的后綴可以是 b、w 或 l。這并不是強(qiáng)制性的；GCC 會(huì)嘗試通過(guò)讀取操作數(shù)來(lái)提供相應(yīng)的后綴。但手工指定后綴可以改善代碼的可讀性，并可以消除編譯器猜測(cè)不正確的可能性。

movb %al, %bl -- Byte move
    movw %ax, %bx -- Word move
    movl %eax, %ebx -- Longword move

立即操作數(shù)
通過(guò)使用 $ 指定直接操作數(shù)。

movl $0xffff, %eax -- will move the value of 0xffff into eax register.

間接內(nèi)存引用
任何對(duì)內(nèi)存的間接引用都是通過(guò)使用 ( ) 來(lái)完成的。

movb (%esi), %al -- will transfer the byte in the memory 
 pointed by esi into al
register

回頁(yè)首

內(nèi)聯(lián)匯編

GCC 為內(nèi)聯(lián)匯編提供特殊結(jié)構(gòu)，它具有以下格式：

GCG 的 "asm" 結(jié)構(gòu)

   asm ( assembler template
    
: output operands               (optional)
    
: input operands                (optional)
    
: list of clobbered registers   
    (optional)
    
);

本例中，匯編程序模板由匯編指令組成。輸入操作數(shù)是充當(dāng)指令輸入操作數(shù)使用的 C 表達(dá)式。輸出操作數(shù)是將對(duì)其執(zhí)行匯編指令輸出的 C 表達(dá)式。

內(nèi)聯(lián)匯編的重要性體現(xiàn)在它能夠靈活操作，而且可以使其輸出通過(guò) C 變量顯示出來(lái)。因?yàn)樗哂羞@種能力，所以 "asm" 可以用作匯編指令和包含它的 C 程序之間的接口。

一個(gè)非?；镜苤匾膮^(qū)別在于 簡(jiǎn)單內(nèi)聯(lián)匯編只包括指令，而 擴(kuò)展內(nèi)聯(lián)匯編包括操作數(shù)。要說(shuō)明這一點(diǎn)，考慮以下示例：

內(nèi)聯(lián)匯編的基本要素

{
    int a=10, b;
    asm ("movl %1, %%eax;
    
movl %%eax, %0;"
        :"=r"(b)  /* output */    
        :"r"(a)       /* input */
        :"%eax"); /* clobbered register */
}

在上例中，我們使用匯編指令使 "b" 的值等于 "a"。請(qǐng)注意以下幾點(diǎn)：

"b" 是輸出操作數(shù)，由 %0 引用，"a" 是輸入操作數(shù)，由 %1 引用。
"r" 是操作數(shù)的約束，它指定將變量 "a" 和 "b" 存儲(chǔ)在寄存器中。請(qǐng)注意，輸出操作數(shù)約束應(yīng)該帶有一個(gè)約束修飾符 "="，指定它是輸出操作數(shù)。
要在 "asm" 內(nèi)使用寄存器 %eax，%eax 的前面應(yīng)該再加一個(gè) %，換句話說(shuō)就是 %%eax，因?yàn)?"asm" 使用 %0、%1 等來(lái)標(biāo)識(shí)變量。任何帶有一個(gè) % 的數(shù)都看作是輸入／輸出操作數(shù)，而不認(rèn)為是寄存器。
第三個(gè)冒號(hào)后的修飾寄存器 %eax 告訴將在 "asm" 中修改 GCC %eax 的值，這樣 GCC 就不使用該寄存器存儲(chǔ)任何其它的值。
movl %1, %%eax 將 "a" 的值移到 %eax 中， movl %%eax, %0 將 %eax 的內(nèi)容移到 "b" 中。
因?yàn)?"b" 被指定成輸出操作數(shù)，因此當(dāng) "asm" 的執(zhí)行完成后，它將反映出更新的值。換句話說(shuō)，對(duì) "asm" 內(nèi) "b" 所做的更改將在 "asm" 外反映出來(lái)。

現(xiàn)在讓我們更詳細(xì)的了解每一項(xiàng)的含義。

回頁(yè)首

匯編程序模板

匯編程序模板是一組插入到 C 程序中的匯編指令（可以是單個(gè)指令，也可以是一組指令）。每條指令都應(yīng)該由雙引號(hào)括起，或者整組指令應(yīng)該由雙引號(hào)括起。每條指令還應(yīng)該用一個(gè)定界符結(jié)尾。有效的定界符為新行 (\n) 和分號(hào) (;)。 '\n' 后可以跟一個(gè) tab(\t) 作為格式化符號(hào)，增加 GCC 在匯編文件中生成的指令的可讀性。指令通過(guò)數(shù) %0、%1 等來(lái)引用 C 表達(dá)式（指定為操作數(shù)）。

如果希望確保編譯器不會(huì)在 "asm" 內(nèi)部?jī)?yōu)化指令，可以在 "asm" 后使用關(guān)鍵字 "volatile"。如果程序必須與 ANSI C 兼容，則應(yīng)該使用 __asm__ 和 __volatile__，而不是 asm 和 volatile。

回頁(yè)首

操作數(shù)

C 表達(dá)式用作 "asm" 內(nèi)的匯編指令操作數(shù)。在匯編指令通過(guò)對(duì) C 程序的 C 表達(dá)式進(jìn)行操作來(lái)執(zhí)行有意義的作業(yè)的情況下，操作數(shù)是內(nèi)聯(lián)匯編的主要特性。

每個(gè)操作數(shù)都由操作數(shù)約束字符串指定，后面跟用括弧括起的 C 表達(dá)式，例如："constraint" (C expression)。操作數(shù)約束的主要功能是確定操作數(shù)的尋址方式。

可以在輸入和輸出部分中同時(shí)使用多個(gè)操作數(shù)。每個(gè)操作數(shù)由逗號(hào)分隔開(kāi)。

在匯編程序模板內(nèi)部，操作數(shù)由數(shù)字引用。如果總共有 n 個(gè)操作數(shù)（包括輸入和輸出），那么第一個(gè)輸出操作數(shù)的編號(hào)為 0，逐項(xiàng)遞增，最后那個(gè)輸入操作數(shù)的編號(hào)為 n -1?？偛僮鲾?shù)的數(shù)目限制在 10，如果機(jī)器描述中任何指令模式中的最大操作數(shù)數(shù)目大于 10，則使用后者作為限制。

回頁(yè)首

修飾寄存器列表

如果 "asm" 中的指令指的是硬件寄存器，可以告訴 GCC 我們將自己使用和修改它們。這樣，GCC 就不會(huì)假設(shè)它裝入到這些寄存器中的值是有效值。通常不需要將輸入和輸出寄存器列為 clobbered，因?yàn)?GCC 知道 "asm" 使用它們（因?yàn)樗鼈儽幻鞔_指定為約束）。不過(guò)，如果指令使用任何其它的寄存器，無(wú)論是明確的還是隱含的（寄存器不在輸入約束列表中出現(xiàn)，也不在輸出約束列表中出現(xiàn)），寄存器都必須被指定為修飾列表。修飾寄存器列在第三個(gè)冒號(hào)之后，其名稱被指定為字符串。

至于關(guān)鍵字，如果指令以某些不可預(yù)知且不明確的方式修改了內(nèi)存，則可能將 "memory" 關(guān)鍵字添加到修飾寄存器列表中。這樣就告訴 GCC 不要在不同指令之間將內(nèi)存值高速緩存在寄存器中。

回頁(yè)首

操作數(shù)約束

前面提到過(guò)，"asm" 中的每個(gè)操作數(shù)都應(yīng)該由操作數(shù)約束字符串描述，后面跟用括弧括起的 C 表達(dá)式。操作數(shù)約束主要是確定指令中操作數(shù)的尋址方式。約束也可以指定：

是否允許操作數(shù)位于寄存器中，以及它可以包括在哪些種類(lèi)的寄存器中
操作數(shù)是否可以是內(nèi)存引用，以及在這種情況下使用哪些種類(lèi)的地址
操作數(shù)是否可以是立即數(shù)

約束還要求兩個(gè)操作數(shù)匹配。

回頁(yè)首

常用約束

在可用的操作數(shù)約束中，只有一小部分是常用的；下面列出了這些約束以及簡(jiǎn)要描述。有關(guān)操作數(shù)約束的完整列表，請(qǐng)參考 GCC 和 GAS 手冊(cè)。

寄存器操作數(shù)約束 (r)
使用這種約束指定操作數(shù)時(shí)，它們存儲(chǔ)在通用寄存器中。請(qǐng)看下例：

asm ("movl %%cr3, %0\n" :"=r"(cr3val));

這里，變量 cr3val 保存在寄存器中，%cr3 的值復(fù)制到寄存器上，cr3val 的值從該寄存器更新到內(nèi)存中。指定 "r" 約束時(shí)，GCC 可以將變量 cr3val 保存在任何可用的 GPR 中。要指定寄存器，必須通過(guò)使用特定的寄存器約束直接指定寄存器名。

a   %eax
b   %ebx
c   %ecx
d   %edx
S   %esi
D   %edi

內(nèi)存操作數(shù)約束 (m)
當(dāng)操作數(shù)位于內(nèi)存中時(shí)，任何對(duì)它們執(zhí)行的操作都將在內(nèi)存位置中直接發(fā)生，這與寄存器約束正好相反，后者先將值存儲(chǔ)在要修改的寄存器中，然后將它寫(xiě)回內(nèi)存位置中。但寄存器約束通常只在對(duì)于指令來(lái)說(shuō)它們是絕對(duì)必需的，或者它們可以大大提高進(jìn)程速度時(shí)使用。當(dāng)需要在 "asm" 內(nèi)部更新 C 變量，而您又確實(shí)不希望使用寄存器來(lái)保存其值時(shí)，使用內(nèi)存約束最為有效。例如，idtr 的值存儲(chǔ)在內(nèi)存位置 loc 中：

 ("sidt %0\n" : :"m"(loc));

匹配（數(shù)字）約束
在某些情況下，一個(gè)變量既要充當(dāng)輸入操作數(shù)，也要充當(dāng)輸出操作數(shù)?？梢酝ㄟ^(guò)使用匹配約束在 "asm" 中指定這種情況。

asm ("incl %0" :"=a"(var):"0"(var));

在匹配約束的示例中，寄存器 %eax 既用作輸入變量，也用作輸出變量。將 var 輸入讀取到 %eax，增加后將更新的 %eax 再次存儲(chǔ)在 var 中。這里的 "0" 指定第 0 個(gè)輸出變量相同的約束。即，它指定 var 的輸出實(shí)例只應(yīng)該存儲(chǔ)在 %eax 中。該約束可以用于以下情況：

輸入從變量中讀取，或者變量被修改后，修改寫(xiě)回到同一變量中
不需要將輸入操作數(shù)和輸出操作數(shù)的實(shí)例分開(kāi)

使用匹配約束最重要的意義在于它們可以導(dǎo)致有效地使用可用寄存器。

回頁(yè)首

一般內(nèi)聯(lián)匯編用法示例

以下示例通過(guò)各種不同的操作數(shù)約束說(shuō)明了用法。有如此多的約束以至于無(wú)法將它們一一列出，這里只列出了最經(jīng)常使用的那些約束類(lèi)型。

"asm" 和寄存器約束 "r" 讓我們先看一下使用寄存器約束 r 的 "asm"。我們的示例顯示了 GCC 如何分配寄存器，以及它如何更新輸出變量的值。

int main(void)
{
    int x = 10, y;
    
    asm ("movl %1, %%eax;
    
 "movl %%eax, %0;"
        :"=r"(y)  /* y is output operand */
        :"r"(x)       /* x is input operand */
        :"%eax"); /* %eax is clobbered register */
}

在該例中，x 的值復(fù)制為 "asm" 中的 y。x 和 y 都通過(guò)存儲(chǔ)在寄存器中傳遞給 "asm"。為該例生成的匯編代碼如下：

main:
pushl %ebp
movl %esp,%ebp
subl $8,%esp
movl $10,-4(%ebp)    
movl -4(%ebp),%edx  /* x=10 is stored in %edx */
#APP    /* asm starts here */   
movl %edx, %eax     /* x is moved to %eax */
movl %eax, %edx     /* y is allocated in edx and updated */
#NO_APP /* asm ends here */
movl %edx,-8(%ebp)  /* value of y in stack is updated with 
                
 the value in %edx */

當(dāng)使用 "r" 約束時(shí)，GCC 在這里可以自由分配任何寄存器。在我們的示例中，它選擇 %edx 來(lái)存儲(chǔ) x。在讀取了 %edx 中 x 的值后，它為 y 也分配了相同的寄存器。

因?yàn)?y 是在輸出操作數(shù)部分中指定的，所以 %edx 中更新的值存儲(chǔ)在 -8(%ebp)，堆棧上 y 的位置中。如果 y 是在輸入部分中指定的，那么即使它在 y 的臨時(shí)寄存器存儲(chǔ)值 (%edx) 中被更新，堆棧上 y 的值也不會(huì)更新。

因?yàn)?%eax 是在修飾列表中指定的，GCC 不在任何其它地方使用它來(lái)存儲(chǔ)數(shù)據(jù)。

輸入 x 和輸出 y 都分配在同一個(gè) %edx 寄存器中，假設(shè)輸入在輸出產(chǎn)生之前被消耗。請(qǐng)注意，如果您有許多指令，就不是這種情況了。要確保輸入和輸出分配到不同的寄存器中，可以指定 & 約束修飾符。下面是添加了約束修飾符的示例。

int main(void)
{
    int x = 10, y;
    
    asm ("movl %1, %%eax;
    
 "movl %%eax, %0;"
        :"=&r"(y) /* y is output operand, note the    
                
 & constraint modifier. */
        :"r"(x)       /* x is input operand */
        :"%eax"); /* %eax is clobbered register */
}

以下是為該示例生成的匯編代碼，從中可以明顯地看出 x 和 y 存儲(chǔ)在 "asm" 中不同的寄存器中。

main:
pushl %ebp
movl %esp,%ebp
subl $8,%esp
movl $10,-4(%ebp)
movl -4(%ebp),%ecx  /* x, the input is in %ecx */
#APP
    movl %ecx, %eax
    movl %eax, %edx     /* y, the output is in %edx */
#NO_APP
movl %edx,-8(%ebp)

回頁(yè)首

特定寄存器約束的使用

現(xiàn)在讓我們看一下如何將個(gè)別寄存器作為操作數(shù)的約束指定。在下面的示例中，cpuid 指令采用 %eax 寄存器中的輸入，然后在四個(gè)寄存器中給出輸出：%eax、%ebx、%ecx、%edx。對(duì) cpuid 的輸入（變量 "op"）傳遞到 "asm" 的 eax 寄存器中，因?yàn)?cpuid 希望它這樣做。在輸出中使用 a、b、c 和 d 約束，分別收集四個(gè)寄存器中的值。

asm ("cpuid"
: "=a" (_eax),
"=b" (_ebx),
"=c" (_ecx),
"=d" (_edx)
: "a" (op));

在下面可以看到為它生成的匯編代碼（假設(shè) _eax、_ebx 等... 變量都存儲(chǔ)在堆棧上）：

movl -20(%ebp),%eax /* store 'op' in %eax -- input */
#APP
cpuid
#NO_APP
movl %eax,-4(%ebp)  /* store %eax in _eax -- output */
movl %ebx,-8(%ebp)  /* store other registers in
movl %ecx,-12(%ebp) 
 respective output variables */
movl %edx,-16(%ebp)

strcpy 函數(shù)可以通過(guò)以下方式使用 "S" 和 "D" 約束來(lái)實(shí)現(xiàn)：

asm ("cld\n
    
rep\n
    
movsb"
    
: /* no input */
    
:"S"(src), "D"(dst), "c"(count));

通過(guò)使用 "S" 約束將源指針 src 放入 %esi 中，使用 "D" 約束將目的指針 dst 放入 %edi 中。因?yàn)?rep 前綴需要 count 值，所以將它放入 %ecx 中。

在下面可以看到另一個(gè)約束，它使用兩個(gè)寄存器 %eax 和 %edx 將兩個(gè) 32 位的值合并在一起，然后生成一個(gè)64 位的值：

#define rdtscll(val) \
 __asm__ __volatile__ ("rdtsc" : "=A" (val))
The generated assembly looks like this (if val has a 64 bit memory space).
#APP
rdtsc
#NO_APP
movl %eax,-8(%ebp)  /* As a result of A constraint 
movl %edx,-4(%ebp)  
 %eax and %edx serve as outputs */
Note here that the values in %edx:%eax serve as 64 bit output.

回頁(yè)首

使用匹配約束

在下面將看到系統(tǒng)調(diào)用的代碼，它有四個(gè)參數(shù)：

#define _syscall4(type,name,type1,arg1,type2,arg2,type3,arg3,type4,arg4) \
type name (type1 arg1, type2 arg2, type3 arg3, type4 arg4) \
{ \
long __res; \
__asm__ volatile ("int $0x80" \
: "=a" (__res) \
: "0" (__NR_##name),"b" ((long)(arg1)),"c" ((long)(arg2)), \
"d" ((long)(arg3)),"S" ((long)(arg4))); \
__syscall_return(type,__res); \
}

在上例中，通過(guò)使用 b、c、d 和 S 約束將系統(tǒng)調(diào)用的四個(gè)自變量放入 %ebx、%ecx、%edx 和 %esi 中。請(qǐng)注意，在輸出中使用了 "=a" 約束，這樣，位于 %eax 中的系統(tǒng)調(diào)用的返回值就被放入變量 __res 中。通過(guò)將匹配約束 "0" 用作輸入部分中第一個(gè)操作數(shù)約束，syscall 號(hào) __NR_##name 被放入 %eax 中，并用作對(duì)系統(tǒng)調(diào)用的輸入。這樣，這里的 %eax 既可以用作輸入寄存器，又可以用作輸出寄存器。沒(méi)有其它寄存器用于這個(gè)目的。另請(qǐng)注意，輸入（syscall 號(hào)）在產(chǎn)生輸出（syscall 的返回值）之前被消耗（使用）。

內(nèi)存操作數(shù)約束的使用

請(qǐng)考慮下面的原子遞減操作：

__asm__ __volatile__(
"lock; decl %0"
:"=m" (counter)
:"m" (counter));

為它生成的匯編類(lèi)似于：

#APP
    lock
    decl -24(%ebp) /* counter is modified on its memory location */
#NO_APP.

您可能考慮在這里為 counter 使用寄存器約束。如果這樣做，counter 的值必須先復(fù)制到寄存器，遞減，然后對(duì)其內(nèi)存更新。但這樣您會(huì)無(wú)法理解鎖定和原子性的全部意圖，這些明確顯示了使用內(nèi)存約束的必要性。

使用修飾寄存器

請(qǐng)考慮內(nèi)存拷貝的基本實(shí)現(xiàn)。

   asm ("movl $count, %%ecx;
    
up: lodsl;  
    
stosl;
    
loop up;"
        :           /* no output */
        :"S"(src), "D"(dst) /* input */
        :"%ecx", "%eax" );  /* clobbered list */

當(dāng) lodsl 修改 %eax 時(shí)，lodsl 和 stosl 指令隱含地使用它。%ecx 寄存器明確裝入 count。但 GCC 在我們通知它以前是不知道這些的，我們是通過(guò)將 %eax 和 %ecx 包括在修飾寄存器集中來(lái)通知 GCC 的。在完成這一步之前，GCC 假設(shè) %eax 和 %ecx 是自由的，它可能決定將它們用作存儲(chǔ)其它的數(shù)據(jù)。請(qǐng)注意，%esi 和 %edi 由 "asm" 使用，它們不在修飾列表中。這是因?yàn)橐呀?jīng)聲明 "asm" 將在輸入操作數(shù)列表中使用它們。這里最低限度是，如果在 "asm" 內(nèi)部使用寄存器（無(wú)論是明確還是隱含地），既不出現(xiàn)在輸入操作數(shù)列表中，也不出現(xiàn)在輸出操作數(shù)列表中，必須將它列為修飾寄存器。

回頁(yè)首

結(jié)束語(yǔ)

總的來(lái)說(shuō)，內(nèi)聯(lián)匯編非常巨大，它提供的許多特性我們甚至在這里根本沒(méi)有涉及到。但如果掌握了本文描述的基本材料，您應(yīng)該可以開(kāi)始對(duì)自己的內(nèi)聯(lián)匯編進(jìn)行編碼了。

參考資料

您可以參閱本文在 developerWorks 全球站點(diǎn)上的英文原文.
請(qǐng)參考 Using and Porting the GNU Compiler Collection (GCC)手冊(cè)。
請(qǐng)參考 GNU Assembler (GAS)手冊(cè)。
仔細(xì)閱讀。

posted on 2010-10-25 11:28 ChinaPanda 閱讀(308) 評(píng)論(0) 編輯收藏引用

只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。
【推薦】100%開(kāi)源！大型工業(yè)跨平臺(tái)軟件C++源碼提供，建模，組態(tài)！



網(wǎng)站導(dǎo)航: 博客園 IT新聞 BlogJava 博問(wèn) Chat2DB 管理

青青草原综合久久大伊人导航_色综合久久天天综合_日日噜噜夜夜狠狠久久丁香五月_热久久这里只有精品

Panda

統(tǒng)計(jì)

常用鏈接

留言簿

隨筆分類(lèi)

隨筆檔案

搜索

最新評(píng)論

閱讀排行榜

評(píng)論排行榜

Linux 中 x86 的內(nèi)聯(lián)匯編