对于以下代码:
#include <stdio.h>
int main() {
printf("Hello World");
printf("Hello World1");
return 0;
}
生成的调用 printf 的程序集如下(64位):
400474: be 24 06 40 00 mov esi,0x400624
400479: bf 01 00 00 00 mov edi,0x1
40047e: 31 c0 xor eax,eax
400480: e8 db ff ff ff call 400460 <__printf_chk@plt>
400485: be 30 06 40 00 mov esi,0x400630
40048a: bf 01 00 00 00 mov edi,0x1
40048f: 31 c0 xor eax,eax
400491: e8 ca ff ff ff call 400460 <__printf_chk@plt>
.rodata 部分如下:
Contents of section .rodata:
400620 01000200 48656c6c 6f20576f 726c6400 ....Hello World.
400630 48656c6c 6f20576f 726c6431 00 Hello World1.
根据汇编代码,对 printf 的第一次调用具有地址为 400624 的参数,该参数从 .rodata 的开头有 4 个字节的偏移量。我知道它在这里跳过了这 4 个点前缀的前 4 个字节。但我的问题是为什么 GCC/链接器为 .rodata 中的字符串生成这个前缀?我在 Ubuntu 14.04 上使用 4.8.4 GCC。编译 cmd 只是:
gcc -Ofast my-source.c -o my-program
。 最佳答案
对于初学者来说,那些不是四个点,点只是表示不可打印的字符。您可以在十六进制转储中看到这些字节是 01 00 02 00
。
最终程序包含链接器添加的其他目标文件,它们是 C 运行时库的一部分。该数据由那里的代码使用。
可以看到地址是 0x400620
。然后您可以尝试找到匹配的符号,例如您可以将其加载到 gdb
并使用 info symbol
命令:
(gdb) info symbol 0x4005f8
_IO_stdin_used in section .rodata of /tmp/a.out
(注意我有一个不同的地址。)
更进一步,您实际上可以找到 source for this in glibc :
/* This records which stdio is linked against in the application. */
const int _IO_stdin_used = _G_IO_IO_FILE_VERSION;
and
#define _G_IO_IO_FILE_VERSION 0x20001
如果您考虑小端存储,这对应于您看到的值。
关于c - 为什么 .rodata 部分中的静态字符串在 GCC 中有四个点前缀?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34733136/