VC++內聯匯編,將MSDN里面關于內聯匯編的幾乎全翻譯了,一上午的成果啊,哪翻譯錯了,告我一聲啊。。。
【一】.在 __asm block中使用匯編語言
1.關鍵字__asm調用內聯匯編語句
有三種方式可用
(1)__asm block 形式
例子:
// asm_overview.cpp
// processor: x86
void __declspec(naked) main()
{
// Naked functions must provide their own prolog...
__asm {
push ebp
mov ebp, esp
sub esp, __LOCAL_SIZE
}
// ... and epilog
__asm {
pop ebp
ret
}
}
(2)將__asm放在每句匯編指令的開頭
例子:
__asm push ebp
__asm mov ebp, esp
__asm sub esp, __LOCAL_SIZE
(3)應為__asm 也是一個語句分隔符,所以可以將匯編指令放在同一行上
例子:
__asm push ebp __asm mov ebp, esp __asm sub esp, __LOCAL_SIZE
2.內聯匯編指令集
VC++編譯器支持Pentium 4 和 AMD Athlon的所有指令,額外的被其他目標處理器支持的指令
能夠被創造用_emit 偽指令。
附:_emit 偽指令說明
_emit偽指令的MASM的DB指令相似,你能夠使用_emit在代碼段(text segment)的當前位置
去定義一個字節的立即數。_emit 一次只能定義一個字節,并且僅僅能夠再代碼段(text segment)
內定義。
例子:
#define randasm __asm _emit 0x4A __asm _emit 0x43 __asm _emit 0x4B
.
.
.
__asm {
randasm
}
3.再內聯匯編中的MASM表達式
內聯匯編能夠使用任何的MASM的表達式,能夠使任何操作數和操作碼的組合。
4.內聯匯編中的數據指令和操作
盡管__asm block能夠引用C/C++的數據類型和對象(object),但是他不能定義數據對象用MASM的指令和操作,尤其,不能使用
DB,DW,DD,DQ,DT,DF 或者DUP,THIS。MASM中結構體和記錄類型也是不可用的,內聯匯編不接受STRUC,RECORD,WIDTH,MASK操作.
5.EVEN 和 ALIGN 指令
盡管內聯匯編不支持大多數MASM的指令,但是支持EVEN 和 ALIGN 指令,這兩個指令填充NOP在匯編代碼中去對其數據和指定的邊界,這樣能夠
CUP的數據訪問更加高效.
6.內聯匯編中的MASM宏指令
內聯匯編不支持MAsm中的宏指令(MACRO, REPT, IRC, IRP, ENDM)或者宏操作符(<>, !, &, %, .TYPE)。
7.內聯匯編中的段引用
再內聯匯編中指定一個段只能通過寄存器,而不能通過名字(例如,段名_TEXT是不可用的),段超越必須顯式的使用寄存器,如ES:[BX].
8.內聯匯編中的類型和變量尺寸問題
LENGTH, SIZE 和 TYPE 操作符有一個限定的意義再內聯匯編中,他們不能被使用和DUP一起(因為再內聯匯編中不能使用DUP命令),但是能夠使
用他們去得到C/C++變量的尺寸和類型.
*LENGTH 操作符返回一個數組的元素數目,非數組變量返回1.
*Size 操作符返回C/C++變量的尺寸,一個變量的尺寸是LENGTH與TYPE相乘的結果.
*TYPE 操作符返回C/C++類型或變量的尺寸,如果是一個數組變量返回數組中單個元素的TYPE.
例子:
int arr[8];
__asm C Size
LENGTH arr sizeof(arr)/sizeof(arr[0]) 8
SIZE arr sizeof(arr) 32
TYPE arr sizeof(arr[0]) 4
9.內聯匯編的注釋問題
再__asm block 中可以使用匯編語言的注釋
例子:
__asm mov ax, offset buff ; Load address of buff
【二】.再__asm block 中使用C/C++
概述:應為內聯匯編能夠與C/C++語句混合使用,他夢能夠使用C/C++的變量通過名字,還有C/C++語言的其他元素.
*符號,包括標號,變量,函數名.
*常量,包括符號常量和枚舉(enum)
*宏,預處理命令
*注釋(包括 /**/和//)
*類型名稱
*typedef名稱,一般都和PTR和TYPE一起使用或者去指定結構體或聯合成員
1.在 __asm block 中使用操作符
再 __asm block 中不能使用 C/C++特有的操作符,例如<<。C/C++與匯編共用的操作符,如*,是被解釋為匯編操作符。
舉個例子來說,[]操作符在C語言里被解釋為數組的下標, C能夠自動的轉換數組元素的尺寸,解釋為首地址+單個元素的長度*方括號內的值.
但是再__asm block中,他被看做 MASM索引操作符(index operator),解釋為首地址+方括號中的值.
下面的實例顯示了他們的不同。
int array[10];
__asm mov array[6], bx ; Store BX at array+6 (not scaled)
array[6] = 0; /* Store 0 at array+24 (scaled) */
能夠使用TYPE操作符去達到和C同樣的效果
__asm mov array[6 * TYPE int], 0 ; Store 0 at array + 24
array[6] = 0; /* Store 0 at array + 24 */
2.使用C/C++符號在__asm block 中
__asm塊能夠引用 C/C++在作用域中的符號(包括變量名,函數名,標號,不能調用C++的成員函數)
在使用C/C++符號時有一些限制:
*每條匯編語句僅僅能夠包含一個C/C++的符號。在LENGTH, TYPE, 和 SIZE表達式中則可以使用多個C/C++符號。
*在__asm block中函數引用必須先聲明。否則編譯器不能區別在__asm block 中的標號與函數名.
*不能使用與MASM保留字相同的符號名稱(無論大小寫)。
*結構體和聯合類型不能別識別在__asm block中.
3.訪問C/C++數據在__asm block中
在內聯匯編中通過名稱訪問C/C++變量是十分方便的。在__asm block中能訪問任何在作用域中符號。
例如,在其作用域中有一個C變量 var, __asm MOV EAX,var 存儲var的值在EAX中。
如果一個類,結構體或者聯合結構的成員是唯一的,在__asm block中引用他僅僅使用成員變量名,
而不用使用變量名或者typedef名在.操作符之前。如果成員名不是唯一的,無論如何,必須放置變量名或者typedef名在.操作符之前。
例子:
// InlineAssembler_Accessing_C_asm_Blocks.cpp
// processor: x86
#include <stdio.h>
struct first_type
{
char *weasel;
int same_name;
};
struct second_type
{
int wonton;
long same_name;
};
int main()
{
struct first_type hal;
struct second_type oat;
__asm
{
lea ebx, hal
mov ecx, [ebx]hal.same_name ; Must use 'hal'
mov esi, [ebx].weasel ; Can omit 'hal'
}
return 0;
}
在 __asm block中能夠訪問C++ 的數據成員而不用去遵守訪問限制,但是不能調用C++的成員函數.
4.使用內聯匯編寫函數
略。沒啥好講的,直接看例子
int power2( int num, int power )
{
__asm
{
mov eax, num ; Get first argument
mov ecx, power ; Get second argument
shl eax, cl ; EAX = EAX * ( 2 to the power of CL )
}
// Return with result in EAX
}
5.使用和保存寄存器在內聯匯編中
一般來說,不應該假設寄存器將會有一個指定的值在__asm blok塊開始時,寄存器的值不保證在離開了一個__asm block后被保存,如果你離開
了一個asm塊并開始了另一個asm塊,不應該應用在上一個塊中保存寄存器的值。An __asm block inherits whatever register values result
from the normal flow of control.
如果使用__fastcall調用約定,編譯器傳遞參數使用寄存器而不是堆棧,這可能產生一個問題在應用了__asm block的函數中,因為函數無法知
道那個參數是在寄存器中。如果一個函數接受參數在EAX中,但是過后別立刻用來存儲其他的值,那摩這個原始的參數就丟失了。并且,在
__fastcall約定中,必須保存ECX寄存器的值。
去避免如此的寄存器沖突,不要使用__fastcall調用約定為那些包含__asm block的函數,如果使用/Gr編譯器選項指定了全局的__fastcall約定
,那摩定義每個包含__asm block的函數用_stdcall或__cdecl。
當使用__asm去寫匯編語句在C/C++中,不需要去保存EAX,EBX,ECX,EDX,ESI,EDI。在使用EBX,ESI,EDI時,你強迫編譯器去保存并回復這些寄存
器的值在函數的序言與結尾處.
也應該保存使用的其他寄存器(如DS,SS,SP,BP,EFLAGS)對于這個__asm block的作用域.
也應該保存ESP和EBP除非你有其他的改變他們的原因。(例如,堆棧轉換)
下面這段不太好翻譯,自己看吧:
Some SSE types require eight-byte stack alignment, forcing the compiler to emit dynamic stack-alignment code. To be able to
access both the local variables and the function parameters after the alignment, the compiler maintains two frame pointers.
If the compiler performs frame pointer omission (FPO), it will use EBP and ESP. If the compiler does not perform FPO, it will
use EBX and EBP. To ensure code runs correctly, do not modify EBX in asm code if the function requires dynamic stack
alignment as it could modify the frame pointer. Either move the eight-byte aligned types out of the function, or avoid using
EBX.
注意:如果在__asm block中改變了方向標志,通過STD,CLD,那摩就要保存這些標志的原始值.
6.在內聯匯編中跳轉到指定標號
像一般的 C/C++標號,在__asm block有函數作用域(在整個函數中可見,而不僅僅是在定義的__asm block中),匯編指令與goto語句都能跳到
標號處.
定義在__asm block中的標號不是大小寫敏感的,goto語句與匯編指令能夠引用整個標號而不用考慮大小寫。但是C/C++代碼中的標號是大小寫
敏感的當使用goto語句時,使用匯編語句不用考慮大小寫問題.
例子:
void func( void )
{
goto C_Dest; /* Legal: correct case */
goto c_dest; /* Error: incorrect case */
goto A_Dest; /* Legal: correct case */
goto a_dest; /* Legal: incorrect case */
__asm
{
jmp C_Dest ; Legal: correct case
jmp c_dest ; Legal: incorrect case
jmp A_Dest ; Legal: correct case
jmp a_dest ; Legal: incorrect case
a_dest: ; __asm label
}
C_Dest: /* C label */
return;
}
int main()
{
}
在__asm block中不要使用C庫的函數名作為標號名稱。
BAD TECHNIQUE: using library function name as label
jne exit
.
.
.
exit:
; More __asm code follows
在MASM中($)符號作為當前的地址計數(current location counter)。他是當前正在被編譯的指令的標號.在__asm block 中他的主要作用
是去作為一個長的條件跳轉.
jne $+5 ; next instruction is 5 bytes long
jmp farlabel
; $+5
.
.
.
farlabel:
【三】.在內聯匯編中調用C函數
一個__asm block能夠調用C函數,包括C庫函數。下面是調用printf的例子:
// InlineAssembler_Calling_C_Functions_in_Inline_Assembly.cpp
// processor: x86
#include <stdio.h>
char format[] = "%s %s\n";
char hello[] = "Hello";
char world[] = "world";
int main( void )
{
__asm
{
mov eax, offset world
push eax
mov eax, offset hello
push eax
mov eax, offset format
push eax
call printf
//clean up the stack so that main can exit cleanly
//use the unused register ebx to do the cleanup
pop ebx
pop ebx
pop ebx
}
}
【四】.定義__asm block作為宏
C語言的宏提供了一個簡便的方式去插匯編代碼進入源代碼。但是那需要額外的小心因為宏被擴展到一個單獨的邏輯行上(a single logical
line),去創建無錯誤的宏,應遵守下列規則:
*用{}包圍__asm block
*放__asm 關鍵字在每條匯編指令的開頭
*使用老式的注釋(/**/)代替匯編中的注釋(;)和單行注釋(//).
例子:
#define PORTIO __asm \
/* Port output */ \
{ \
__asm mov al, 2 \
__asm mov dx, 0xD007 \
__asm out dx, al \
}
一個__asm block寫的宏能夠帶參數,但是不能返回值,因此不要使用這樣的宏在C/C++表達式中.
【五】.內聯匯編的優化問題
__asm block的存在會對優化產生一些影響。首先,編譯器不會嘗試去優化__asm block中的指令。第二,__asm block會對寄存器變量的存儲產
生影響,編譯器會避免去登記穿越__asm block的那些寄存器會被修改的變量.
posted on 2008-12-21 17:07
楊彬彬 閱讀(9279)
評論(1) 編輯 收藏 引用