1.fork函数是什么
fork()函数通过系统调用创建一个与原来进程几乎完全相同的进程,也就是两个进程可以做完全相同的事情,但如果初始参数或者传入的变量不同,两个进程也可以做不同的事情。
2.刷题题目
在刷题的时候我发现这个函数比较有趣,整理一篇文章分享一下。
题目:请问下面的程序一共输出多少个“-”?
int main(void)
{
int i;
for (i = 0; i < 2; i++) {
fork();
printf("-");
}
return 0;
}
当我看了fork函数的定义之后,以为他只会输出4个“-”,但是是不对的,应该输出8个“-”。
想要正确解出这道题,必须要先理解fork函数的工作特性:
- fork()系统调用的是Unix下以自身进程创建子进程的系统调用,一次调用两次返回,而它可能有三种不同的返回值:
- 返回的值>0(创建子进程的进程ID),是父进程
- 返回的值=0,是子进程
- 返回的值<0,进程出现错误
- fork()调用的地方,整个父进程空间会原模原样地复制到子进程中,包括指令,变量值,程序调用栈,环境变量,缓冲区等等。
现在我们再来分析一下:
fork() i=0
printf("-");
fork() i=1
printf("-");
printf("-");
printf("-");
fork() i=1
printf("-");
printf("-");
可以看到一共输出了6次“-”,但是距离正确答案还差两次,是哪里出错了呢。
这是因为printf("-");
语句有buffer,所以,对于上述程序,printf(“-“);
把“-”放到了缓存中,并没有真正的输出,在fork的时候,缓存被复制到了子进程空间,所以就多了两个,成了8个。
如果我们修改printf("-");
为printf("-\n");
或者
printf("-");
fflush(stdout);
那就只会输出6个“-”了,因为程序遇到了“\n”或EOF或是缓冲区满,或是文件描述符关闭,或是主动flush,或是程序退出,就会把数据刷出缓冲区。需要注意的是,标准输出是行缓冲,所以遇到“\n”的时候会刷出缓冲区,但对于磁盘这个块设备来说,“\n”并不会引起缓冲区刷出的动作,那是全缓冲,你可以使用setvbuf
来设置缓冲区大小,或是用fflush
刷缓存。
3.进一步理解(https://coolshell.cn/articles/7965.html)
我们把上面的程序改成下面这样:
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
int main(void)
{
int i;
for(i=0; i<2; i++){
fork();
//注意:下面的printf有“\n”
printf("ppid=%d, pid=%d, i=%d \n", getppid(), getpid(), i);
}
sleep(10); //让进程停留十秒,这样我们可以用pstree查看一下进程树
return 0;
}
上面的程序会输出以下结果:
ppid=8858, pid=8518, i=0
ppid=8858, pid=8518, i=1
ppid=8518, pid=8519, i=0
ppid=8518, pid=8519, i=1
ppid=8518, pid=8520, i=1
ppid=8519, pid=8521, i=1
$ pstree -p | grep fork
|-bash(8858)-+-fork(8518)-+-fork(8519)---fork(8521)
| | `-fork(8520)
画个图理解一下:
注意:上图中的我用了几个色彩,相同颜色的是同一个进程。于是,我们的pstree的图示就可以成为下面这个样子:(下图中的颜色与上图对应)
这样,对于printf(“-“);这个语句,我们就可以很清楚的知道,哪个子进程复制了父进程标准输出缓中区里的的内容,而导致了多次输出了。(如下图所示,就是我阴影并双边框了那两个子进程)
Reference
https://www.cnblogs.com/jeakon/archive/2012/05/26/2816828.html
https://coolshell.cn/articles/7965.html