我最近需要在汇编级别调试程序。我没有太多的汇编程序经验,所以我认为我会写一些简单的C程序并单步调试它们,以便在开始调试其他人的代码之前对这种语言有所了解。但是,我真的不明白这两行(与-ggdb -O0编译)组成的gcc是什么:

items[tail] = i;
tail = (tail+1) % MAX_SIZE;

其中MAX_SIZE#定义为5,我是一个局部变量(我想是存储在0x8(%ebp)中)。根据gdb,这变为:
0x08048394 <queue+17>:  mov    0x8049634,%edx
0x0804839a <queue+23>:  mov    0x8(%ebp),%eax
0x0804839d <queue+26>:  mov    %eax,0x804963c(,%edx,4)
0x080483a4 <queue+33>:  mov    0x8049634,%eax
0x080483a9 <queue+38>:  lea    0x1(%eax),%ecx
0x080483ac <queue+41>:  movl   $0x66666667,-0xc(%ebp)
0x080483b3 <queue+48>:  mov    -0xc(%ebp),%eax
0x080483b6 <queue+51>:  imul   %ecx
0x080483b8 <queue+53>:  sar    %edx
0x080483ba <queue+55>:  mov    %ecx,%eax
0x080483bc <queue+57>:  sar    $0x1f,%eax
0x080483bf <queue+60>:  mov    %edx,%ebx
0x080483c1 <queue+62>:  sub    %eax,%ebx
0x080483c3 <queue+64>:  mov    %ebx,-0x8(%ebp)
0x080483c6 <queue+67>:  mov    -0x8(%ebp),%eax
0x080483c9 <queue+70>:  shl    $0x2,%eax
0x080483cc <queue+73>:  add    -0x8(%ebp),%eax
0x080483cf <queue+76>:  mov    %ecx,%edx
0x080483d1 <queue+78>:  sub    %eax,%edx
0x080483d3 <queue+80>:  mov    %edx,-0x8(%ebp)
0x080483d6 <queue+83>:  mov    -0x8(%ebp),%ebx
0x080483d9 <queue+86>:  mov    %ebx,0x804963

由于0x804963c是项的地址,因此我可以看到C代码的第一行是如何工作的。另外,0x8049634是tail的地址,所以我猜queue + 33和queue + 38等效于%ecx = tail + 1 ...,但是我不知道之后会发生什么。谁会想到一个简单的模可能会如此复杂?

最佳答案

这是一种避免执行更昂贵的除法指令的方法。第一次遇到这个问题,我也很沮丧。有趣的是,搜索用于此技巧的魔术数字(在本例中为0x66666667)通常会给出解释该技巧的结果。 (我相信当时这是我唯一必须继续做的事情,因为我没有消息来源。)

快速搜索为我提供了该博客文章:http://blog.dkbza.org/2007/09/reverse-engineering-compiler-produced.html它的底部具有一些有用的链接(包括对该技巧的论文的间接链接)。

10-02 04:48