考虑以下简单的共享库源代码:
library.cpp:
static int global = 10;
int foo()
{
return global;
}
使用clang中的
-fPIC
选项进行编译,将导致该对象组合件(x86-64):foo(): # @foo()
push rbp
mov rbp, rsp
mov eax, dword ptr [rip + global]
pop rbp
ret
global:
.long 10 # 0xa
由于符号是在库中定义的,因此编译器将按预期使用PC相对地址:
mov eax, dword ptr [rip + global]
但是,如果我们将
static int global = 10;
更改为int global = 10;
使其成为具有外部链接的符号,则所得程序集为:foo(): # @foo()
push rbp
mov rbp, rsp
mov rax, qword ptr [rip + global@GOTPCREL]
mov eax, dword ptr [rax]
pop rbp
ret
global:
.long 10 # 0xa
如您所见,编译器在全局偏移表中添加了一个间接层,在这种情况下,由于符号仍在同一库(和源文件)中定义,因此似乎完全没有必要。
如果符号是在另一个共享库中定义的,则GOT是必需的,但是在这种情况下,它显得多余。为何编译器仍将此符号添加到GOT?
注意:我相信this question与此类似,但是答案可能不适当,可能是由于缺少细节。
最佳答案
全局偏移表有两个目的。一种是允许动态链接器“插入”与可执行文件或其他共享对象不同的变量定义。第二个是允许生成位置无关的代码,以引用某些处理器体系结构上的变量。
ELF动态链接将整个过程,可执行文件和所有共享对象(动态库)视为共享一个全局 namespace 。如果多个组件(可执行或共享对象)定义了相同的全局符号,则动态链接程序通常选择该符号的一个定义,并且所有组件中对该符号的所有引用都引用该一个定义。 (但是,ELF动态符号解析很复杂,由于各种原因,不同的组件最终可能会使用同一全局符号的不同定义。)
为此,在构建共享库时,编译器将通过GOT间接访问全局变量。对于每个变量,将在GOT中创建一个条目,其中包含指向该变量的指针。如您的示例代码所示,编译器将使用该条目获取变量的地址,而不是尝试直接访问它。当共享对象加载到进程中时,动态链接器将确定是否任何全局变量已被另一个组件中的变量定义所取代。如果是这样,这些全局变量将更新其GOT条目以指向取代变量。
通过使用“隐藏的”或“ protected ” ELF可见性属性,可以防止全局定义的符号被另一个组件中的定义所取代,从而消除了在某些体系结构上使用GOT的需要。例如:
extern int global_visible;
extern int global_hidden __attribute__((visibility("hidden")));
static volatile int local; // volatile, so it's not optimized away
int
foo() {
return global_visible + global_hidden + local;
}
当使用带有GCC x86_64端口的
-O3 -fPIC
编译时,会生成:foo():
mov rcx, QWORD PTR global_visible@GOTPCREL[rip]
mov edx, DWORD PTR local[rip]
mov eax, DWORD PTR global_hidden[rip]
add eax, DWORD PTR [rcx]
add eax, edx
ret
如您所见,只有
global_visible
使用GOT,而global_hidden
和local
不使用GOT。 “ protected ”可见性的工作原理类似,它阻止了定义的取代,但仍对动态链接器可见,因此可以被其他组件访问。 “隐藏”可见性完全隐藏了动态链接器中的符号。为了使共享对象可以在不同的进程中加载到不同的地址而使代码可重定位的必要性,意味着在大多数体系结构上,静态分配的变量(无论是全局范围还是局部范围)都无法通过单个指令直接访问。如上所示,我知道的唯一异常(exception)是64位x86体系结构。它支持与PC相对的内存操作数,并且具有较大的32位位移,可以达到在同一组件中定义的任何变量。
在所有其他架构上,我熟悉以位置相关的方式访问变量需要多个指令。各个架构的精确度差异很大,但通常涉及使用GOT。例如,如果使用
-m32 -O3 -fPIC
选项使用GCC的x86_64端口编译上面的示例C代码,则会得到:foo():
call __x86.get_pc_thunk.dx
add edx, OFFSET FLAT:_GLOBAL_OFFSET_TABLE_
push ebx
mov ebx, DWORD PTR global_visible@GOT[edx]
mov ecx, DWORD PTR local@GOTOFF[edx]
mov eax, DWORD PTR global_hidden@GOTOFF[edx]
add eax, DWORD PTR [ebx]
pop ebx
add eax, ecx
ret
__x86.get_pc_thunk.dx:
mov edx, DWORD PTR [esp]
ret
GOT用于所有三个变量访问,但是如果仔细观察,
global_hidden
和local
的处理方式与global_visible
不同。对于后面的变量,可以通过GOT访问指向该变量的指针,对于前两个变量,可以直接通过GOT访问它们。在所有位置独立变量引用都使用GOT的体系结构中,这是一个相当普遍的技巧。32位x86体系结构在这里是一种异常(exception),因为它具有较大的32位位移和32位地址空间。这意味着可以通过GOT基本访问存储器中的任何地方,而不仅仅是GOT本身。大多数其他架构仅支持较小的位移,这使得距GOT基础的最大距离要小得多。使用此技巧的其他体系结构只会将小(本地/隐藏/ protected )变量放在GOT本身中,大变量存储在GOT外部,并且GOT将包含指向该变量的指针,就像普通可见性全局变量一样。
关于c++ - 为什么要将全局偏移表用于共享库本身中定义的符号?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/55587313/