我最近需要在汇编级别调试程序。我没有太多的汇编程序经验,所以我认为我会写一些简单的C程序并单步调试它们,以便在开始调试其他人的代码之前对这种语言有所了解。但是,我真的不明白这两行(与-ggdb -O0编译)组成的gcc是什么:
items[tail] = i;
tail = (tail+1) % MAX_SIZE;
其中MAX_SIZE#定义为5,我是一个局部变量(我想是存储在0x8(%ebp)中)。根据gdb,这变为:
0x08048394 <queue+17>: mov 0x8049634,%edx
0x0804839a <queue+23>: mov 0x8(%ebp),%eax
0x0804839d <queue+26>: mov %eax,0x804963c(,%edx,4)
0x080483a4 <queue+33>: mov 0x8049634,%eax
0x080483a9 <queue+38>: lea 0x1(%eax),%ecx
0x080483ac <queue+41>: movl $0x66666667,-0xc(%ebp)
0x080483b3 <queue+48>: mov -0xc(%ebp),%eax
0x080483b6 <queue+51>: imul %ecx
0x080483b8 <queue+53>: sar %edx
0x080483ba <queue+55>: mov %ecx,%eax
0x080483bc <queue+57>: sar $0x1f,%eax
0x080483bf <queue+60>: mov %edx,%ebx
0x080483c1 <queue+62>: sub %eax,%ebx
0x080483c3 <queue+64>: mov %ebx,-0x8(%ebp)
0x080483c6 <queue+67>: mov -0x8(%ebp),%eax
0x080483c9 <queue+70>: shl $0x2,%eax
0x080483cc <queue+73>: add -0x8(%ebp),%eax
0x080483cf <queue+76>: mov %ecx,%edx
0x080483d1 <queue+78>: sub %eax,%edx
0x080483d3 <queue+80>: mov %edx,-0x8(%ebp)
0x080483d6 <queue+83>: mov -0x8(%ebp),%ebx
0x080483d9 <queue+86>: mov %ebx,0x804963
由于0x804963c是项的地址,因此我可以看到C代码的第一行是如何工作的。另外,0x8049634是tail的地址,所以我猜queue + 33和queue + 38等效于%ecx = tail + 1 ...,但是我不知道之后会发生什么。谁会想到一个简单的模可能会如此复杂?
最佳答案
这是一种避免执行更昂贵的除法指令的方法。第一次遇到这个问题,我也很沮丧。有趣的是,搜索用于此技巧的魔术数字(在本例中为0x66666667
)通常会给出解释该技巧的结果。 (我相信当时这是我唯一必须继续做的事情,因为我没有消息来源。)
快速搜索为我提供了该博客文章:http://blog.dkbza.org/2007/09/reverse-engineering-compiler-produced.html它的底部具有一些有用的链接(包括对该技巧的论文的间接链接)。