程序如下,判断输出多少个'_'

./a.out

int main(){
for(int i = ; i < ; ++i){
fork();
printf("_");
}
}

熟悉fork的话,这里很容易就能知道,一共产生了3个子进程,还有一个父进程,所以一共是四个进程;每次fork之后都会输出一个'_',那么在这里应当的输出是6个'_'

一道值得思考的fork()面试题-LMLPHP

但是实际输出却是 8个'_'; 但是如果在printf("_")之后使用fflush(stdout),或者使用printf("\n")清空输出缓冲区来输出则结果就是6个了,这就不得不再返回来谈一谈printf的输出机制。

  • 标准I/O对待缓存的数据采用3种不同的策略,全缓冲、行缓冲、无缓冲。
  • 对于没有交互的终端,例如块设备文件,系统采用全缓冲;(比如输出到文件)
  • 对于标准输入,标准输出这样交互设备采用行缓冲;(输出到屏幕或控制台)
  • 对于需要立即响应的设备,例如标准错误采用无缓冲;

printf函数只有当缓冲区被刷新的时候才会输出数据,在此之前只是将数据存放到缓冲区。

理解了这点后,再去分析上述代码;首先只有一个进程a.out,缓冲区为空;第一次fork()后,父进程a.out产生了一个子进程“子1”,子进程复制父进程的缓冲区(此时为空),然后printf将"_"先放入缓冲区内,a.out与"子1"的缓冲区内各有一个"_";

第二次fork()后,a.out产生了一个子进程"子2",“子1”产生了一个子进程“子3”,“子2”和“子3”均从各自的父进程复制了缓冲区的“_”,此时,a.out,"子1",“子2”,“子3”各自的缓冲区内均有一个“_”,接下来的printf语句又将”_“分别放入了四个进程的缓冲区内(图中用黑色标识的_),此时,循环结束,四个进程的各自缓冲区内都分别有两个"_",总共8个,特殊之处在于,”子2“与”子3“的缓冲区内的第一个”_“是复制各自的父进程缓冲区得到的,a.out与"子1"的缓冲区内的第一个"_"是printf累积”_“的结果。如此一来,循环结束后,程序就要结束了,此时缓冲区刷新输出了8个"_".

一道值得思考的fork()面试题-LMLPHP

到这里,这道题已经讲的很明白了,为了深入理解,再通过几个代码详细理解一下缓冲区的刷新机制:

int main(){
printf("hello");
//fflush(stdout);
sleep();
int m = ;
m = ;
while(m-->){
printf("*");
}
//printf("\n");
sleep();
printf("world");
}

这个程序将如何输出呢?如果去掉注释输出结果又是什么?先思考一下吧。

理想中的输出应该是先输出 "hello",等待5秒,输出7个'*',再等待3秒,输出"world";但是实际情况却是等待 8秒,一瞬间输出”hello*******world“.

如果去掉注释呢?就是我们所期盼的第一种情况了;造成这种现象的原因上面已经提到了,就是printf并非直接输出,而是先攒到缓冲区里,等待缓冲区刷新再输出;这段程序中的两条注释语句均可以刷新行缓冲策略的缓冲区(行缓冲与全缓冲在文章末尾)。

那么来看一下缓冲区刷新的时机吧

  • 1.遇到“\n”,立即刷新缓冲区。(行缓冲)
  • 2.程序调用fflush函数刷新缓冲区
  • 3.程序以exit结束,缓冲区会刷新。如果以_exit结束,缓冲区数据会被直接清空。
  • 4.缓冲区满,也会将缓冲区数据刷新出来。

这样子便不难理解了吧。可惜刚开始学习printf的时候总是习惯性在后面加一个'\n',所以这么久了这么重要的一个缓冲区机制居然才知道。

最后再用一个例子补充一下行缓冲与全缓冲的区别

int main(){
printf("hello world\r\n");
if( == fork()){
printf("son\r\n");
}else{
printf("father\r\n");
}
}

先普通执行一下输出结果为一条"hello world",一条"son",以及一条"father";

再将输出位置重定向到文件,输出结果多了一条"hello world"

一道值得思考的fork()面试题-LMLPHP

一道值得思考的fork()面试题-LMLPHP

同样的程序,只因为输出位置的不同,结果也就不同,这是因为第一种使用了标准输出也就是控制台和屏幕,采用行缓冲策略;第二种将标准输出重定向到文件,采用的是全缓冲策略;行缓冲策略中的'\n'对全缓冲无效;所以又回到了文章开始的那道面试题的缓冲区复制。由于是全缓冲,并不会刷新缓冲区,因此fork时子进程复制了父进程的缓冲区,里面有一条”hello world“,此时父子进程再各自往缓冲区中攒了"father"和'son';因此就呈现出最终的输出结果啦。

(这种缓冲区机制在C++中的cout也是一样的)

完。

05-27 16:43