对于以下代码:

#include <stdio.h>

int main() {
    printf("Hello World");
    printf("Hello World1");
    return 0;
}

生成的调用 printf 的程序集如下(64位):
  400474:   be 24 06 40 00          mov    esi,0x400624
  400479:   bf 01 00 00 00          mov    edi,0x1
  40047e:   31 c0                   xor    eax,eax
  400480:   e8 db ff ff ff          call   400460 <__printf_chk@plt>
  400485:   be 30 06 40 00          mov    esi,0x400630
  40048a:   bf 01 00 00 00          mov    edi,0x1
  40048f:   31 c0                   xor    eax,eax
  400491:   e8 ca ff ff ff          call   400460 <__printf_chk@plt>

.rodata 部分如下:
Contents of section .rodata:
 400620 01000200 48656c6c 6f20576f 726c6400  ....Hello World.
 400630 48656c6c 6f20576f 726c6431 00        Hello World1.

根据汇编代码,对 printf 的第一次调用具有地址为 400624 的参数,该参数从 .rodata 的开头有 4 个字节的偏移量。我知道它在这里跳过了这 4 个点前缀的前 4 个字节。但我的问题是为什么 GCC/链接器为 .rodata 中的字符串生成这个前缀?我在 Ubuntu 14.04 上使用 4.8.4 GCC。编译 cmd 只是: gcc -Ofast my-source.c -o my-program

最佳答案

对于初学者来说,那些不是四个点,点只是表示不可打印的字符。您可以在十六进制转储中看到这些字节是 01 00 02 00

最终程序包含链接器添加的其他目标文件,它们是 C 运行时库的一部分。该数据由那里的代码使用。

可以看到地址是 0x400620 。然后您可以尝试找到匹配的符号,例如您可以将其加载到 gdb 并使用 info symbol 命令:

(gdb) info symbol 0x4005f8
_IO_stdin_used in section .rodata of /tmp/a.out

(注意我有一个不同的地址。)

更进一步,您实际上可以找到 source for this in glibc :
/* This records which stdio is linked against in the application. */
const int _IO_stdin_used = _G_IO_IO_FILE_VERSION;

and
#define _G_IO_IO_FILE_VERSION 0x20001

如果您考虑小端存储,这对应于您看到的值。

关于c - 为什么 .rodata 部分中的静态字符串在 GCC 中有四个点前缀?,我们在Stack Overflow上找到一个类似的问题:https://stackoverflow.com/questions/34733136/

10-11 18:44