内核态的page fault?
前段时间有同事问了个问题:内核中是否可能发生page fault?
一时没能给出准确答案,当即有种感觉:难道是对内核内存管理的理解还不够,之前在这方面还是比较自信的~
问题看似很简单,从之前的理解来看,以经典的32位X86为例,内核态低端地址都是线性映射的,页表都是事先(内核初始化时)创建好的,对于这段地址,应该不会发生page fault;但对于vmalloc区,是通过页表动态映射的,这部分显然是可能发生缺页的。
看似问题有答案了,但TX问的不是针对内核态地址发送的缺页,而是:在内核态下,对用户态地址的访问,是否发生page fault?
我追问了一句:什么情况下,内核态需要访问用户态地址? 回答:比如copy_from_user.
问题清晰了,这种情况下,可能发生缺页吗?
硬件层面
从硬件层面上来说,当CPU做访问操作时,MMU硬件会遍历页表,查找匹配的映射条目,如果没有找到,就会自动触发page fault。
所以,从这个角度看,只要copy_from_user参数中的用户态地址对应的页表项不存在,就会产生page fault。
不应该发生吧?
换个角度,内核要使用copy_from_user从用户态拷贝数据时,按理数据应该都已经准备好了吧,也就是说相应的内存(物理)应该都已经分配好了把,不应该发生page fault了吧?
正常情况下,的确如此,但万一内核非要访问未映射的用户态地址呢?万一用户态数据此时没有准备好呢?谁能保证?
所以,虽然不应该发生,但还是可能发送的。
有什么不一样么?
这种情况下,在内核中发生的page fault,与平常我们见到的在用户态发生的page fault有什么不同么?
在用户态时,发生缺页时,CPU硬件会切换到到特权模式(内核态),进行异常处理;在内核态时发生缺页,由于当前本来就出于内核态,所以处理方式肯定会有不同。这也许只是一方面,应该还有其它不同~
如何处理的?
在page fault的流程中针对Vmalloc区发生的缺页有专门的处理,可以参见vmalloc_fault函数。
那对于copy_from_user的情况呢?
肯定的。其实就是do_page_fault流程中exception table相关的处理,之前对这里的代码没有仔细理解清楚,原来就是用来处理这种情况的。
为什么要用copy_from_user?
还是回到老问题,为什么要用copy_from_user,按理解,拷贝数据,不就是从一个地址搬移数据到另一个地址,用memcpy不就好了?
就是因为可能发生page fault的情况,memcpy对这种情况没有任何的处理措施,可能引发不可知的后果。
而copy_from_user对这种情况进行了处理,处理方式就是在代码中增加了一个.fixup的段,该段在do_page_fault中会被读取,结合exception table进行相应的修正,具体修正方式,没时间深入研究了,感兴趣可以继续看看。
copy_from_user代码如下: