_cdecl、_stdcall、_fastcall函數呼叫約定區別

2020-08-12 19:01:59

1. 函數呼叫過程

在C語言中,假設我們有這樣的一個函數:

int function(int a,int b)

呼叫時只要用result = function(1,2)這樣的方式就可以使用這個函數。但是,當高階語言被編譯成計算機可以識別的機器碼時,有一個問題就凸現出來:在CPU中,計算機沒有辦法知道一個函數呼叫需要多少個、什麼樣的參數,也沒有硬體可以儲存這些參數。也就是說,計算機不知道怎麼給這個函數傳遞參數,傳遞參數的工作必須由函數呼叫者和函數本身來協調。爲此,計算機提供了一種被稱爲棧的數據結構來支援參數傳遞。

棧是一種先進後出的數據結構,棧有一個儲存區、一個棧頂指針。棧頂指針指向堆疊中第一個可用的數據項(被稱爲棧頂)。使用者可以在棧頂上方向棧中加入數據,這個操作被稱爲壓棧(Push),壓棧以後,棧頂自動變成新加入數據項的位置,棧頂指針也隨之修改。使用者也可以從堆疊中取走棧頂,稱爲彈出棧(pop),彈出棧後,棧頂下的一個元素變成棧頂,棧頂指針隨之修改。

一個函數呼叫過程大致如此:呼叫者依次把參數壓棧,然後呼叫函數,函數被呼叫以後,在堆疊中取得數據,並進行計算。函數計算結束以後,或者呼叫者、或者函數本身修改堆疊,使堆疊恢復原狀。

2. 函數呼叫約定

在參數傳遞中,有兩個很重要的問題必須得到明確說明:

  • 當參數個數多於一個時,按照什麼順序把參數壓入堆疊 (壓棧總是由呼叫者完成)
  • 函數呼叫後,由誰來把堆疊復原

在高階語言中,通過函數呼叫約定來說明這兩個問題。常見的呼叫約定有:

  • stdcall
  • cdecl
  • fastcall
  • thiscall
  • naked call

另外還需提到的一點是:不同的呼叫約定也會使得編譯後的函數名稱修飾不一樣。

2.1 stdcall呼叫約定

stdcall很多時候被稱爲pascal呼叫約定,因爲pascal是早期很常見的一種教學用計算機程式設計語言,其語法嚴謹,使用的函數呼叫約定就是stdcall。在Microsoft C++系列的C/C++編譯器中,常常用PASCAL宏來宣告這個呼叫約定,類似的宏還有WINAPI和CALLBACK。(PS:Win32 API都遵循_stdcall呼叫約定)

stdcall呼叫約定宣告的語法爲(以前文的那個函數爲例):

int __stdcall function(int a,int b)

stdcall的呼叫約定意味着:

  1. 參數從右向左壓入堆疊;
  2. 函數自身修改堆疊 ;
  3. 函數名自動加前導的下劃線,後面緊跟一個@符號,其後緊跟着參數的尺寸

呼叫者呼叫function(1,2)呼叫處翻譯成彙編語言將變成:

push 2        第二個參數b入棧
push 1        第一個參數a入棧
call function    呼叫函數,注意此時自動把cs:eip入棧

而對於函數自身,則可以翻譯爲:

push ebp       儲存ebp暫存器,該暫存器將用來儲存堆疊的棧頂指針,可以在函數退出時恢復
mov ebp, esp    儲存堆疊指針
mov eax,[ebp + 8H] 堆疊中ebp指向位置之前依次儲存有ebp, cs:eip, a, b, ebp +8指向a
add eax,[ebp + 0CH] 堆疊中ebp + 12處儲存了b
mov esp, ebp    恢復esp
pop ebp            恢復ebp,
ret 8              參數出棧

在編譯時,這個函數的名字被翻譯成**_function@8**

注意不同編譯器會插入自己的彙編程式碼以提供編譯的通用性,但是大體程式碼如此。其中在函數開始處保留esp到ebp中,在函數結束恢復是編譯器常用的方法。

從函數呼叫看,2和1依次被push進堆疊,而在函數中又通過相對於ebp(即剛進函數時的堆疊指針)的偏移量存取參數。函數結束後,ret 8表示清理8個位元組的堆疊,函數自己恢復了堆疊

2.2 cdecl呼叫約定

cdecl呼叫約定又稱爲C呼叫約定,是C語言預設的呼叫約定(Visual Studio中C/C++預設的呼叫約定),它的定義語法是:

int function (int a ,int b)      //不加修飾就是C呼叫約定
int __cdecl function(int a,int b) //明確指出C呼叫約定

cdecl呼叫約定的參數壓棧順序是和stdcall是一樣的,參數首先由右向左壓入堆疊。所不同的是,函數本身不清理堆疊,呼叫者負責清理堆疊。由於這種變化,C呼叫約定允許函數的參數的個數是不固定的,這也是C語言的一大特色。對於前面的function函數,使用cdecl後的彙編碼變成:

呼叫者在呼叫function處的程式碼:

push 1
push 2
call function
add esp, 8     注意:這裏是呼叫者在恢復堆疊

被呼叫函數_function處:

push ebp        儲存ebp暫存器,該暫存器將用來儲存堆疊的棧頂指針,可以在函數退出時恢復
mov ebp,esp      儲存堆疊指針
mov eax,[ebp + 8H] 堆疊中ebp指向位置之前依次儲存有ebp,cs:eip,a,b,ebp +8指向a
add eax,[ebp + 0CH] 堆疊中ebp + 12處儲存了b
mov esp,ebp      恢復esp
pop ebp             恢復3bp
ret           注意,這裏沒有修改堆疊

MSDN中說,該修飾自動在函數名前加前導的下劃線,因此函數名在符號表中被記錄爲_function,但是我在編譯時似乎沒有看到這種變化。

由於參數按照從右向左順序壓棧,因此最開始的參數在最接近棧頂的位置,因此當採用不定個數參數時,第一個參數在棧中的位置肯定能知道,只要不定的參數個數能夠根據第一個後者後續的明確的參數確定下來,就可以使用不定參數,例如對於CRT中的sprintf函數,定義爲:
int sprintf(char* buffer,const char* format,…) 由於所有的不定參數都可以通過format確定,因此使用不定個數的參數是沒有問題的。

2.3 fastcall呼叫約定

fastcall呼叫約定和stdcall類似,它意味着:

  • 函數的第一個和第二個DWORD參數(或者尺寸更小的)通過ecx和edx傳遞,其他參數通過從右向左的順序壓棧
  • 被呼叫函數清理堆疊
  • 函數名修改規則同stdcall

fastcall方式的函數採用暫存器傳遞參數,VC將函數編譯後會在函數名前面加上"@「字首,在函數名後加上」@"和參數的位元組數

2.4 thiscall呼叫約定

thiscall是唯一一個不能明確指明的函數修飾,因爲thiscall不是關鍵字。它是C++類別成員函數預設的呼叫約定。由於成員函數呼叫還有一個this指針,因此必須特殊處理,thiscall意味着:

  • 參數從右向左入棧
  • 如果參數個數確定,this指針通過ecx傳遞給被呼叫者;如果參數個數不確定,this指針在所有參數壓棧後被壓入堆疊。對參數個數不定的,呼叫者清理堆疊,否則函數自己清理堆疊爲了說明這個呼叫約定,定義如下類和使用程式碼:
class A
{
public:
int function1(int a,int b);
int function2(int a,...);
};

int A::function1 (int a,int b)
{
return a+b;
}

#include <stdarg.h>
int A::function2(int a,...)
{
va_list ap;
va_start(ap,a);
int i;
int result = 0;
for(i = 0 ; i < a ; i ++)
{
result += va_arg(ap,int);
}
return result;
}

void callee()
{
A a;
a.function1(1, 2);
a.function2(3, 1, 2, 3);
}

callee函數被翻譯成彙編後就變成:

//函數function1呼叫
00401C1D  push    2
00401C1F  push    1
00401C21  lea     ecx,[ebp-8]
00401C24  call    function1     注意,這裏this沒有被入棧

//函數function2呼叫
00401C29  push    3
00401C2B  push    2
00401C2D  push    1
00401C2F  push    3
00401C31  lea     eax, [ebp-8]    這裏引入this指針
00401C34  push    eax
00401C35  call    function2
00401C3A  add     esp, 14h

可見,對於參數個數固定情況下,它類似於stdcall,不定時則類似cdecl

2.5 naked呼叫約定

這是一個很少見的呼叫約定,一般程式設計者建議不要使用。編譯器不會給這種函數增加初始化和清理程式碼,更特殊的是,你不能用return返回返回值,只能用插入彙編返回結果。這一般用於真實模式驅動程式設計,假設定義一個求和的加法程式,可以定義爲:

__declspec(naked) int add(int a,int b)
{
__asm mov eax,a
__asm add eax,b
__asm ret 
}

注意,這個函數沒有顯式的return返回值,返回通過修改eax暫存器實現,而且連退出函數的ret指令都必須顯式插入。上面程式碼被翻譯成彙編以後變成:

mov eax,[ebp+8]
add eax,[ebp+12]
ret 8

注意這個修飾是和__stdcall及cdecl結合使用的,前面是它和cdecl結合使用的程式碼,對於和stdcall結合的程式碼,則變成:

__declspec(naked) int __stdcall function(int a,int b)
{
__asm mov eax,a
__asm add eax,b
__asm ret 8    //注意後面的8
}

至於這種函數被呼叫,則和普通的cdecl及stdcall呼叫函數一致。

如果定義的約定和使用的約定不一致,則將導致堆疊被破壞,導致嚴重問題,下面 下麪是兩種常見的問題:

  • 函數原型宣告和函數體定義不一致
  • DLL匯入函數時宣告瞭不同的函數約定

以後者爲例,假設我們在dll種宣告瞭一種函數爲:

__declspec(dllexport) int func(int a,int b);  //注意,這裏沒有stdcall,使用的是cdecl

使用時程式碼爲:

typedef int (*WINAPI DLLFUNC)func(int a,int b);
hLib = LoadLibrary(...);
DLLFUNC func = (DLLFUNC)GetProcAddress(...) //這裏修改了呼叫約定
result = func(1,2);                         //導致錯誤

由於呼叫者沒有理解WINAPI的含義錯誤的增加了這個修飾,上述程式碼必然導致堆疊被破壞,MFC在編譯時插入的checkesp函數將告訴你,堆疊被破壞.

3. 總結

函數呼叫約定_stdcall、_cdecl、fastcall、thiscall、naked call是爲了指明呼叫函數時參數入棧順序,呼叫完成後出棧動作由呼叫函數執行還是由被呼叫函數自己執行,另外不同的呼叫約定也會使得編譯器對函數的修飾名採用不同的規則。值得注意的一點是:對於Windows API一般都是採用_stdcall、對於Visual Studio中C/C++的預設呼叫約定是_cdecl。

4. 參考

主要:http://www.cnblogs.com/DxSoft/archive/2010/10/27/1862221.html
其他:https://blog.csdn.net/Windgs_YF/article/details/87360747