本周学习了《庖丁解牛》第1章,以及《Linux内核设计与实现》第1、2、18章。通过视频和实验,学会了反汇编一个简单的C程序,也学习了Linux内核调试的一些小技巧和printk
函数。
反汇编一个简单的C程序
- 程序编写及编译
- 使用
vi
编辑源代码
返回值是15,我学号的后两位。 - 使用
gcc
命令编译为32位的汇编代码 - 汇编代码
- 使用
:g
删除辅助信息 - 精简后的汇编代码
- 汇编代码分析
接下来逐行分析堆栈、寄存器的变化。在此采用了和书中一样的简化表示方法,减4位转化为加1位,对应下移一格;加4位转化为减1位;对应为上移1格。
- 初始状态
- 第18行
将ebp
的值压栈,esp
减1,下移一格。 - 第19行
将esp
的值赋值给ebp
。 - 第20行
esp
下移一格。 - 第21行
立即寻址,立即值7赋值到esp
所指的位置。 - 第22行
call f
相当于push %eip
(仅仅这样表示 )和mov1 f, %eip
(仅仅这样表示),因此下一行第23行入栈,esp
下移一格,并将f函数的第一行9赋值给eip
。 - 第9、10行
cpu从eip
读取指令,程序运行第9行,将ebp
的值压栈,esp
减1,下移一格。
第10行将esp
的值赋值给ebp
。
第9、10行相当enter
指令,用于建立函数堆栈。 - 第11行
esp
下移一格。 - 第12行
移位寻址,将ebp
上移两格后所指的值赋值给eax
。 - 第13行
将eax
的值赋值给esp
所指向的位置。 - 第14行
call g
相当于push %eip
(仅仅这样表示 )和mov1 g, %eip
(仅仅这样表示),因此下一行第15行入栈,esp
下移一格,并将g函数的第一行2赋值给eip
。 - 第2、3行
cpu从eip
读取指令,程序运行第2行,将ebp
的值压栈,esp
减1,下移一格。
第3行将esp
的值赋值给ebp
。
第2、3行相当enter
指令,用于建立函数堆栈。一共建立了2个站,后面需要2两个leave
指令。 - 第4行
移位寻址,将ebp
上移两格后所指的值赋值给eax
。 - 第5行
将eax
的值加5,赋值给eax
。 - 第6行
出栈,并把值赋值给ebp
,赋值为4,ebp
指向4,esp
由于popl
操作上移一格。 - 第7行
ret
相当于popl %eip
(仅仅这样表示),执行一次出栈操作,eip
值变成15,esp
上移一格。 - 第15行
cpu从eip
读取指令,程序运行第15行,leave
是撤销函数堆栈,相当于movl %ebp,%esp
和popl %ebp
,esp
先指向与ebp
相同的位置4,再进行一次出栈操作,ebp
的值变为1,指向位置1;esp
上移一格。 - 第16行
ret
执行一次出栈操作,eip
值变成23,esp
上移一格。 - 第23行
cpu从eip
读取指令,程序运行第23行,将将eax
的值加3,赋值给eax
。 - 第24行
leave
是撤销函数堆栈,相当于movl %ebp,%esp
和popl %ebp
,esp
先指向与ebp
相同的位置1,再进行一次出栈操作,ebp
的值变为0,指向位置0;esp
上移一格,也指向0。 - 第25行
ret
执行一次出栈操作,此时栈内已经无数据了。最后eax
是默认的保存返回值的寄存器。
随着程序的进行,堆栈也发生了变化,最后回归初始状态。
《Linux内核设计与实现》读书小结
阅读本书,学会了一些与内核相关的知识。
- 使用
asm()
指令可以嵌入汇编代码。 - 分支声明
likely
和unlikely
。 - 内核中内存不分页,每多用一个字节,物理内存就减少一个字节。
- 内核并不能完美地支持浮点数的操作。
- 内核中要格外注意竞争条件引发的同步和并发。
- 调试bug需要先找到bug,最好能够复现。
- 在内核中使用
printk
函数。可以设定日志级别,<0><1><2><3><4><5><6><7>分别对应不同紧急程度的信息。 oops
是内核发出错误信息、寄存器信息、回溯信息的方式。- 原子操作——能够不分隔执行的代码;以及在执行中不能中断否则就是完不成的代码。
- 内核调用
BUG_ON()
标记bug,提供断言并输出信息,调用时会引发oops
。 - Magic SysRq key是调试、挽救即将崩溃的系统所必须的工具。
- 探测系统可以使用UID(用户ID)作为选择条件(与进程有关),使用条件变量(与进程无关)或者统计量。还可以进行重复频率限制和次数限制。
- 使用数学上的二分法可以更快的找出第一次BUG出现的内核版本。
总结
- 计算机是怎样工作的?
采用用冯诺依曼体系结构的计算机,其核心是存储程序计算机。这类计算机由内存、CPU、输入设备、输出设备组成。内存包括程序内存和数据内存,CPU包括运算器、控制器和寄存器。计算机在执行程序之前必须把要执行的相关程序和数据放入内存中,在执行程序时CPU根据当前程序指针寄存器的内容取出指令并执行指令,然后再取出下一条指令并执行,如此循环下去直到程序结束指令时才停止执行。其工作过程就是不断地取指令和执行指令的过程,最后将计算的结果放入指令指定的存储器地址中。