[轉載內容,地址不詳]
Visual C++ Compiler Options可以指定的Calling Convention有 3種:
  /Gd /Gr /Gz
  這三個參數決定了:
  1.函數參數以何種順序入棧,右到左還是左到右。
  2.在函數運行完后,是調用函數還是被調用函數清理入棧的參數。
  3.在編譯時函數名字是如何轉換的。

  下面我們分別詳細介紹:
  1./Gd
  這是編譯器默認的轉換模式,對一般函數使用 C的函數調用轉換方式__cdecl,但是對于C++ 成員函數和前面修飾了__stdcall __fastcall的函數除外。
  2./Gr
  對于一般函數使用__fastcall函數調用轉換方式,所有使用__fastcall的函數必須要有函數原形。但對于C++ 成員函數和前面修飾了__cdecl __stdcall 的函數除外。
  3./Gz
  對于所有 C函數使用__stdcall函數調用轉換方式,但對于可變參數的 C函數以及用__cdecl __fastcall修飾過的函數和C++ 成員函數除外。所有用__stdcall修飾的函數必須有函數原形。
  事實上,對于x86系統,C++ 成員函數的調用方式有點特別,將成員函數的this
指針放入ECX,所有函數參數從右向左入棧,被調用的成員函數負責清理入棧的
參數。對于可變參數的成員函數,始終使用__cdecl的轉換方式。
  下面該進入主題,分別講一下這三種函數調用轉換方式有什么區別:
  1.__cdecl
  這是編譯器默認的函數調用轉換方式,它可以處理可變參數的函數調用。參數的入棧順序是從右向左。在函數運行結束后,由調用函數負責清理入棧的參數。在編譯時,在每個函數前面加上下劃線(_),沒有函數名大小寫的轉換。即_functionname
  每一個調用它的函數都包含清空堆棧的代碼,所以產生的可執行文件大小會比調用_stdcall函數的大。函數采用從右到左的壓棧方式。注意:對于可變參數的成員函數,始終使用__cdecl的轉換方式。
  2.__fastcall
  有一些函數調用的參數被放入ECX,EDX中,而其它參數從右向左入棧。被調用函數在它將要返回時負責清理入棧的參數。在內嵌匯編語言的時候,需要注意寄存器的使用,以免與編譯器使用的產生沖突。函數名字的轉換是:@functionname@number沒有函數名大小寫的轉換,number表示函數參數的字節數。由于有一些參數不 需要入棧,所以這種轉換方式會在一定程度上提高函數調用的速度。
  3.__stdcall
  函數參數從右向左入棧,被調用函數負責入棧參數的清理工作。函數名轉換格式如下:_functionname@number
  下面我們親自寫一個程序,看看各種不同的調用在編譯后有什么區別,我們的被調 用函數如下:

int function(int a, int b)
{
    
return a + b;
}
void main()
{
    function(
1020);
}

1.__cdecl

_function
push    ebp
mov     ebp, esp
mov     eax, [ebp+8]       ;參數1
add     eax, [ebp+C]       ;加上參數2
pop     ebp
retn
_main
push    ebp
mov     ebp, esp
push    14h                ;參數 2入棧
push    0Ah                ;參數 1入棧
call    _function          ;調用函數
add     esp, 8             ;修正棧
xor     eax, eax
pop     ebp
retn

2.__fastcall

@function@8
push    ebp
mov     ebp, esp           ;保存棧指針
sub     esp, 8             ;多了兩個局部變量
mov     [ebp-8], edx       ;保存參數 2
mov     [ebp-4], ecx       ;保存參數 1
mov     eax, [ebp-4]       ;參數 1
add     eax, [ebp-8]       ;加上參數 2
mov     esp, ebp           ;修正棧
pop     ebp
retn
_main
push    ebp
mov     ebp, esp
mov     edx, 14h           ;參數 2給EDX
mov     ecx, 0Ah           ;參數 1給ECX
call    @function@8        ;調用函數
xor     eax, eax
pop     ebp
retn

3.__stdcall

_function@8
push    ebp
mov     ebp, esp
mov     eax, [ebp]         ;參數 1
add     eax, [ebp+C]       ;加上參數 2
pop     ebp
retn    8                  ;修復棧
_main
push    ebp
mov     ebp, esp
push    14h                ;參數 2入棧
push    0Ah                ;參數 1入棧
call    _function@8    ;函數調用
xor     eax, eax
pop     ebp
retn
可見上述三種方法各有各的特點,而且_main必須是__cdecl,一般WIN32的函數都是__stdcall。而且在Windef.h中有如下的定義:
#define CALLBACK __stdcall
#define WINAPI  __stdcall


  補:
  C++編譯時函數名修飾約定規則:
  __stdcall調用約定:
  1)、以"?"標識函數名的開始,后跟函數名;
  2)、函數名后面以"@@YG"標識參數表的開始,后跟參數表;
  3)、參數表以代號表示:
  X--void ,
  D--char,
  E--unsigned char,
  F--short,
  H--int,
  I--unsigned int,
  J--long,
  K--unsigned long,
  M--float,
  N--double,
  _N--bool,
  PA--表示指針,后面的代號表明指針類型,如果相同類型的指針連續出現,以"0"代替,一個"0"代表一次重復;
  4)、參數表的第一項為該函數的返回值類型,其后依次為參數的數據類型,指針標識在其所指數據類型前;
  5)、參數表后以"@Z"標識整個名字的結束,如果該函數無參數,則以"Z"標識結束。
  其格式為"?functionname@@YG*****@Z"或"?functionname@@YG*XZ",例如   int Test1(char *var1,unsigned long)-----“?Test1@@YGHPADK@Z”   void Test2() -----“?Test2@@YGXXZ
  __cdecl調用約定:
  規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的"@@YG"變為"@@YA"。
  __fastcall調用約定:
  規則同上面的_stdcall調用約定,只是參數表的開始標識由上面的"@@YG"變為"@@YI"。
  VC++對函數的省缺聲明是"__cedcl",將只能被C/C++調用.
  注意:
  1、_beginthread需要__cdecl的線程函數地址,_beginthreadex和CreateThread需要__stdcall的線程函數地址。
  2、一般WIN32的函數都是__stdcall。而且在Windef.h中有如下的定義:
  #define CALLBACK __stdcall
  #define WINAPI  __stdcall
  3、extern "C" _declspec(dllexport) int __cdecl Add(int a, int b);
  typedef int (__cdecl*FunPointer)(int a, int b);
  修飾符的書寫順序如上。
  4、 extern "C"的作用:如果Add(int a, int b)是在c語言編譯器編譯,而在c++文件使用,則需要在c++文件中聲明:extern "C" Add(int a, int b),因為c編譯器和c++編譯器對函數名的解釋不一樣(c++編譯器解釋函數名的時候要考慮函數參數,這樣是了方便函數重載,而在c語言中不存在函數重 載的問題),使用extern "C",實質就是告訴c++編譯器,該函數是c庫里面的函數。如果不使用extern "C"則會出現鏈接錯誤。
  一般象如下使用:
  #ifdef _cplusplus
  #define EXTERN_C extern "C"
  #else
  #define EXTERN_C extern
  #endif
  #ifdef _cplusplus
  extern "C"{
  #endif
  EXTERN_C int func(int a, int b);
  #ifdef _cplusplus
  }
  #endif
  5、MFC提供了一些宏,可以使用AFX_EXT_CLASS來代替__declspec(DLLexport),并修飾類名,從而導出類,AFX_API_EXPORT來修飾函數,AFX_DATA_EXPORT來修飾變量
  AFX_CLASS_IMPORT:__declspec(DLLexport)
  AFX_API_IMPORT:__declspec(DLLexport)
  AFX_DATA_IMPORT:__declspec(DLLexport)
  AFX_CLASS_EXPORT:__declspec(DLLexport)
  AFX_API_EXPORT:__declspec(DLLexport)
  AFX_DATA_EXPORT:__declspec(DLLexport)
  AFX_EXT_CLASS:#ifdef _AFXEXT
  AFX_CLASS_EXPORT
  #else
  AFX_CLASS_IMPORT
  6、 DLLMain負責初始化(Initialization)和結束(Termination)工作,每當一個新的進程或者該進程的新的線程訪問DLL時, 或者訪問DLL的每一個進程或者線程不再使用DLL或者結束時,都會調用DLLMain。但是,使用TerminateProcess或 TerminateThread結束進程或者線程,不會調用DLLMain。
  7、一個DLL在內存中只有一個實例
  DLL程序和調用其輸出函數的程序的關系:
  1)、DLL與進程、線程之間的關系
  DLL模塊被映射到調用它的進程的虛擬地址空間。
  DLL使用的內存從調用進程的虛擬地址空間分配,只能被該進程的線程所訪問。
  DLL的句柄可以被調用進程使用;調用進程的句柄可以被DLL使用。
  DLLDLL可以有自己的數據段,但沒有自己的堆棧,使用調用進程的棧,與調用它的應用程序相同的堆棧模式。
  2)、關于共享數據段
  DLL 定義的全局變量可以被調用進程訪問;DLL可以訪問調用進程的全局數據。使用同一DLL的每一個進程都有自己的DLL全局變量實例。如果多個線程并發訪問 同一變量,則需要使用同步機制;對一個DLL的變量,如果希望每個使用DLL的線程都有自己的值,則應該使用線程局部存儲(TLS,Thread Local Strorage)