以fork()函数为例,分析内核态进程切换的实现

首先在用户态的某个进程中执行了fork()函数

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

fork引发中断,切入内核,内核栈绑定用户栈

首先分析五段论中的第一段:

中断入口:先把相关寄存器压栈保存,然后call真正的fork系统调用

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

当前进程被阻塞或时间片到后,使用调度算法进行线程切换

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

reschedule的展开:其实是把ret_from_sys_call的地址压栈(作用之后就会看到),然后再去进行调度算法

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

此时的内核栈:??2后是内核当前的esp指针

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

第五段和调度算法:执行完调度算法后,即cpu已经调度到新的进程,此时从内核态返回用户态,这时就要用到ret_from_sys_cal

注意eax里存的是返回值,返回的位置是新的进程

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

中间三段论:

switch_to:把cpu从一个内核栈调度到另一个内核栈,即找到目标进程的tcb,这样就完成了一次切换。

  但是linux0.11用了tss方式,即用tcb保留当前进程的运行情况(保留下所有相关寄存器的值,可以理解为运行现场的照相),然后把新的进程的tcb保存的运行现场扣给所有寄存器

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

内嵌汇编注释:

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP:新TSS描述符赋值给TR(32位)

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP:把TR赋值给tmp.b

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP:跳转到tmp.a执行,ljmp是长跳转指令,需要64位的目标操作数

因为fork的工作时建立一个新的进程

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

copy_process函数里需要把父进程的所有寄存器信息赋值给子进程(子进程目前和父进程是一样的)

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

创建子进程的内核栈和绑定的用户栈

给p分配一页内核空间,esp0指向栈顶,由于子进程和父进程共用用户栈,所以绑定的用户栈和父进程也一样

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

copy时的一些细节:

  因为是fork所以新的tss先复制旧的tss

  然后进程切换,内存也跟着切换

  eax要变成0(之后会说)

  因为新的进程需要被调度,所以状态设置为0

  同时也必须填写两个栈

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

fork的一些特别之处

1.返回值有两个:父进程非0,子进程为0,(res和eax是绑定的,子进程的eax在tss中被置为0了,而父进程的eax在第一段里被压栈保存了,返回值是子进程pid)

2.子进程在被创建后,返回到用户态运行时会阻塞父进程,那么父进程什么时候返回?是子进程阻塞或退出后cpu调度到父进程时,通过iret返回到父进程对应的用户态的

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

那么调用fork的结果就是:父进程等待,子进程运行

exec系统调用可以调用cmd命令:exec返回前,子进程执行和父进程一样的代码,返回后就,子进程就开始调用cmd,和父进程不一样了

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

 那么如何才能让子进程找到a并开始运行?

调用do_execve后,a在编译链接时会产生一个链接地址(入口地址entry),通常a的第一句就是a的入口地址,从这个入口地址进入就可以按指令运行a了

所以exec就是找到a的入口地址,将其赋值给ret作为用户栈的返回地址返回,那么返回后就可以直接从a入口地址开始运行a了

Linux0.11内核源码——内核态线程(进程)切换的实现-LMLPHP

05-11 19:59
查看更多