对于常见的指令集,在指令层面没有所谓的“函数”概念,只有“子程序”概念。子程序是存储在“主程序”之外的一段指令。子程序通过call指令调用,通过ret指令返回。子程序可以使用内存、堆栈和寄存器。通常主程序会传递参数给子程序,子程序将执行结果返回给主程序。这些参数和返回值如何传递,可以由开发者决定。不过如果程序中同时使用了高级语言和汇编语言,为了让编译器生成的汇编代码可以正确的汇编和连接,必须采用一个双方都遵守的传递参数和返回值的方法。这就是调用约定。换言之,调用约定是为了保证了不同函数可以正确汇编和链接而设计的,主程序和子程序之间传递数据的方式。
从上面的说明可以看到,调用约定涉及参数和返回值两部分。早期的高级语言(比如C)只有一个返回值,因此返回值的传递也较为简单。下表总结了几个平台上返回值的传递方法:
| 平台 | 整型 | 结构体 | 浮点型 |
| x86 | eax | eax | st(0) |
| x86-64 | rax | rax | xmm0 |
| ARM | R0 | R0 | R0 |
| ARM64 | R0 | R0 | R0 |
调用约定中比较复杂的是参数传递方法,其中又以x86平台的调用约定种类繁多。
x86参数传递在32位x86系统上,由于寄存器数量较少,参数主要通过栈传递,也产生了比较多的调用方式。MSVC和GCC支持的32位调用约定有:
| 关键字 | 清理堆栈 | 参数传递 |
| __cdecl | caller | 从右向左将参数压栈。 |
| __clrcall | n/a | 将参数从左向右加入CLR表达式栈。 |
| __stdcall | callee | 从右向左将参数压栈。 |
| __fastcall | callee | 优先使用寄存器ecx和edx传递参数,然后才使用堆栈。 |
| __thiscall | callee | 通过ecx传递this指针,其他参数通过栈传递。 |
| __vectorcall | callee | 从右向左传递参数,优先使用寄存器ecx和edx,然后才使用堆栈。 |
通过栈传递参数时,栈的结构如下:
16(%ebp) - third function parameter
12(%ebp) - second function parameter
8(%ebp) - first function parameter
4(%ebp) - old %EIP (the function's "return address")
0(%ebp) - old %EBP (previous function's base pointer)
-4(%ebp) - first local variable
-8(%ebp) - second local variable
-12(%ebp) - third local variable
x86-64参数传递x86-64拥有比较多的寄存器,因此主要通过寄存器传递参数,调用约定也较为统一。MSVC编译器通过rcx、rdx、r8、r9传递前4个参数,其余参数同过栈传递,正如下面的例子:
void func1(int a, int b, int c, int d, int e);
// a: rcx, b: rdx, c: r8, d: r9, e: stack
如果函数的参数是结构体,编译器将这个结构体的指针作为实际参数传递。如果参数是浮点数,将通过寄存器xmm0、xmm1、xmm2和xmm3传递。如果参数中既有整数又有浮点数,编译器将按照下面的例子传递参数:
void func2(int a, fouble b, int c, float d);
// a: rcx b: xmm1 c: r8 d: xmm3
如果参数通过栈传递,调用者(caller)负责清理堆栈。C++程序的this指针通常作为第一个参数,通过rcx传递。
在Linux上,GCC优先通过rdi、rsi、rdx、rcx、r8、r9传递参数。对于浮点数参数,GCC使用xmm0-xmm7寄存器。和MSVC一样,GCC也要求调用者清理堆栈。同时,GCC也将C++的this指针作为第一个参数。因此在GCC中,this指针通过rdi传递。
参考资料