一、fork后的父子进程
由fork创建的新进程被称为子进程(child process)。
该函数被调用一次,但返回两次。两次返回的区别是子进程的返回值是0
,而
父进程的返回值则是新进程(子进程)的进程 id。将子进程id返回给父进程的理由是:因为一个进程的子进程可以多于一个,没有一个函数使一个进程可以获得其所有子进程的进程id
。对子进程来说,之所以fork返回0给它,是因为它随时可以调用
getpid()来获取自己的pid;也可以调用getppid()来获取父进程的id
。(进程id 0总是由交换进程使用,所以一个子进程的进程id不可能为0 )。
fork之后,
操作系统会复制一个与父进程完全相同的子进程,虽说是父子关系,但是在操作系统看来,他们更像兄弟关系,这2个进程共享代码空间,但是数据空间是互相独立的,子进程数据空间中的内容是父进程的完整拷贝,指令指针也完全相同,子进程拥有父进程当前运行到的位置
(两进程的程序计数器pc值相同,也就是说,子进程是从fork返回处开始执行的),但有一点不同,如果fork成功,子进程中fork的返回值是0,父进程中fork的返回值是子进程的进程号,如果fork不成功,父进程会返回错误。
可以这样想象,2个进程一直同时运行,而且步调一致,在fork之后,他们分别作不同的工作,也就是分岔了。这也是fork为什么叫fork的原因
至于那一个最先运行,可能与操作系统(调度算法)有关,而且这个问题在实际应用中并不重要,如果需要父子进程协同,可以通过原语的办法解决。
-
include <stdio.h>
-
#include <unistd.h>
-
#include <stdlib.h>
-
#include <errno.h>
-
-
int
main(
void
)
-
{
-
pid_t pid=fork();
-
if
(pid==0)
-
{
-
int
j ;
-
for
(j=0;j<10;j++)
-
{
-
printf(
“child: %d\n”
,j);
-
sleep(1);
-
}
-
}
-
else
if
(pid>0)
-
{
-
int
i;
-
for
(i=0;i<10;i++)
-
{
-
printf(
“parent: %d\n”
,i);
-
sleep(1);
-
}
-
}
-
else
-
{
-
fprintf(stderr,
“can’t fork ,error %d\n”
,errno);
-
exit(1);
-
}
-
printf(
“This is the end !”
);
-
}
二、fork出的子进程和父进程的继承关系
fork出来的子进程,基本上除了进程号之外父进程的所有东西都有一份拷贝,基本就意味着不是全部,下面我们要说的是子进程从父进程那里继承了什么东西,什么东西没有继承。还有一点需要注意,子进程得到的只是父进程的拷贝,而不是父进程资源的本身。
由子进程自父进程继承到:
1.进程的资格(真实(real)/有效(effective)/已保存(saved)用户号(UIDs)和组号(GIDs))
2.环境(environment)
3.堆栈
4.内存
5.打开文件的描述符(注意对应的文件的位置由父子进程共享,这会引起含糊情况)
6.执行时关闭(close-on-exec) 标志 (译者注:close-on-exec标志可通过fnctl()对文件描述符设置,POSIX.1要求所有目录流都必须在exec函数调用时关闭。更详细说明,参见《UNIX环境高级编程》 W. R. Stevens, 1993, 尤晋元等译(以下简称《高级编程》), 3.13节和8.9节)
7.信号(signal)控制设定
8.nice值 (译者注:nice值由nice函数设定,该值表示进程的优先级,数值越小,优先级越高)
进程调度类别(scheduler class)(译者注:进程调度类别指进程在系统中被调度时所属的类别,不同类别有不同优先级,根据进程调度类别和nice值,进程调度程序可计算出每个进程的全局优先级(Global process prority),优先级高的进程优先执行)
8.进程组号
9.对话期ID(Session ID) (译者注:译文取自《高级编程》,指:进程所属的对话期(session)ID, 一个对话期包括一个或多个进程组, 更详细说明参见《高级编程》9.5节)
10.当前工作目录
11.根目录 (译者注:根目录不一定是“/”,它可由chroot函数改变)
12.文件方式创建屏蔽字(file mode creation mask (umask))(译者注:译文取自《高级编程》,指:创建新文件的缺省屏蔽字)
13.资源限制
14.控制终端
子进程所独有:
进程号
1.不同的父进程号(译者注:即子进程的父进程号与父进程的父进程号不同, 父进程号可由getppid函数得到)
2.自己的文件描述符和目录流的拷贝(译者注:目录流由opendir函数创建,因其为顺序读取,顾称“目录流”)
3.子进程不继承父进程的进程,正文(text), 数据和其它锁定内存(memory locks)(译者注:锁定内存指被锁定的虚拟内存页,锁定后,4.不允许内核将其在必要时换出(page out),详细说明参见《The GNU C Library Reference Manual》 2.2版, 1999, 3.4.2节)
5.在tms结构中的系统时间(译者注:tms结构可由times函数获得,它保存四个数据用于记录进程使用中央处理器 (CPU:Central Processing Unit)的时间,包括:用户时间,系统时间, 用户各子进程合计时间,系统各子进程合计时间)
6.资源使用(resource utilizations)设定为0
8.阻塞信号集初始化为空集(译者注:原文此处不明确,译文根据fork函数手册页稍做修改)
9.不继承由timer_create函数创建的计时器
10.不继承异步输入和输出
在fork()/execve()过程中,假如子进程完结时父进程仍存在,而父进程fork()之前既没安装SIGCHLD信号处理函数调用waitpid()期待子进程完结,又没有显式疏忽该信号,则子进程成为僵尸进程,无法正常完结,此时即便是root身份kill-9也不能杀死僵尸进程。弥补方法是杀死僵尸进程的父进程(僵尸进程的父进程必定存在),僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会担任清算僵尸进程。
僵尸进程是指的父进程已经退出,而该进程dead之后没有进程接收,就成为僵尸进程.(zombie)进程
怎么发生僵尸进程的:
一个进程在调用exit命令完结自己的性命的时分,其实它并没有真正的被烧毁,而是留下一个称为僵尸进程(Zombie)的数据结构(体系调用exit,它的作用是使进程退出,但也仅仅限于将一个正常的进程变成一个僵尸进程,并不能将其完整烧毁)。在Linux进程的状况中,僵尸进程
是十分特别的一种,它已经废弃了简直一切内存空间,没有任何可履行代码,也不能被调度,仅仅在进程列表中保存一个地位,记录该进程的退
出状况等信息供其余进程搜集,除此之外,僵尸进程不再占有任何内存空间。它须要它的父进程来为它收尸,假如他的父进程没安装SIGCHLD信
号处理函数调用wait或waitpid()期待子进程完结,又没有显式疏忽该信号,那么它就始终维持僵尸状况,假如这时父进程完结了,那么init进程主动
会接手这个子进程,为它收尸,它还是能被清除的。然而假如假如父进程是一个循环,不会完结,那么子进程就会始终维持僵尸状况,这就是为什么体系中有时会有很多的僵尸进程。
Linux体系对运行的进程数量有限制,假如发生过多的僵尸进程占用了可用的进程号,将会招致新的进程无法生成。这就是僵尸进程对体系的最大伤害。
僵尸进程实例:
/*—–zombie1.c—–*/
#include “sys/types.h”
#include “sys/wait.h”
#include “stdio.h”
#include “unistd.h”
int main(int argc, char* argv[])
{
while(1)
{
pid_t chi = fork();
if(chi == 0)
{
execl(“/bin/bash”,”bash”,”-c”,”ls”,NULL);
}
sleep(2);
}
会不停地发生僵死进程ls;
/*—–zombie2.c—–*/
#include <stdio.h>
#include<sys/types.h>
main()
{
if(!fork())
{
printf(“child pid=%d\n”, getpid());
exit(0);
}
/*wait();*/
/*waitpid(-1,NULL,0);*/
sleep(60);
printf(“parent pid=%d \n”, getpid());
exit(0);
}
60s内会始终发生僵尸进程,晓得父进程exit(0);
假如在调用wait/waitpid来为子进程收尸,就不会发生僵尸进程了。
PS:运行例子,先gcc zombie1.c -o zombie编译,而后运行zombie;
而后可以可用ps -ef来检查能否发生了僵尸进程。
怎么检查僵尸进程:
应用命令ps,可以看到有标记为Z的进程就是僵尸进程。
怎么来清除僵尸进程:
1.改写父进程,在子进程死后要为它收尸。具体做法是接收SIGCHLD信号。子进程死后,会发送SIGCHLD信号给父进程,父进程收到此信号后,履行 waitpid()函数为子进程收尸。这是基于这样的原理:就算父进程没有调用wait,内核也会向它发送SIGCHLD音讯,只管对的默许处理是疏忽,假如想响应这个音讯,可以设置一个处理函数。
2.把父进程杀掉。父进程死后,僵尸进程成为”孤儿进程”,过继给1号进程init,init始终会担任清算僵尸进程.它发生的一切僵尸进程也跟着消逝。
在Linux中可以用
ps auwx
发现僵尸进程
a all w/ tty, including other users 一切窗口和终端,包含其余用户的进程
u user-oriented 面向用户(用户友爱)
-w,w wide output 宽格式输入
x processes w/o controlling ttys
在僵尸进程后面 会标注
ps axf
看进程树,以树形方法现实进程列表
ps axm
会把线程列出来,在linux下进程和线程是对立的,是轻量级进程的两种方法。
ps axu
显示进程的具体状况
===========================================
killall
kill -15
kill -9
个别都不能杀掉 defunct进程
用了kill -15,kill -9以后 之后反而会多出更多的僵尸进程
kill -kill pid
fuser -k pid
可以斟酌杀死他的parent process,
kill -9 他的parent process
=========================================== 一个已经终止,然而其父进程尚未对其进行善后处理(获取终止子进程的有关信息、开释它仍占用的资源)的进程被称为僵死进程(Zombie Process)。
避免zombie的方法:
1)在SVR4中,假如调用signal或sigset将SIGCHLD的配置设置为疏忽,则不会发生僵死子进程。另外,运用SVR4版的 sigaction,则可设置SA_NOCLDWAIT标记以避免子进程僵死。
Linux中也可运用这个,在一个程序的开始调用这个函数
signal(SIGCHLD,SIG_IGN);
2)调用fork两次。程序8 – 5 完成了这一点。
3)用waitpid期待子进程返回.
===========================================
zombie进程是僵死进程。避免它的方法,一是用wait,waitpid之类的函数取得
进程的终止状况,以开释资源。另一个是fork两次
===========================================
defunct进程只是在process table里还有一个记录,其余的资源没有占用,除非你的体系的process个数的限制已经快超越了,zombie进程不会有更多的害处。
可以惟一的方法就是reboot体系可以清除zombie进程。
===========================================
任何程序都有僵尸状况,它占用一点内存资源(也就是进程表里还有一个记录),仅仅是表象而已不用畏惧。假如程序有问题有时机遇见,处理少量量僵尸简单有效的方法是重起。kill是无任何后果的
fork与zombie/defunct”
在Unix下的一些进程的运作方法。当一个进程死亡时,它并不是完整的消逝了。进程终止,它不再运行,然而还有一些残留的小货色期待父进程发出。这些残留的货色包含子进程的返回值和其余的一些货色。当父进程 fork()一个子进程后,它必需用 wait() 或许 waitpid() 期待子进程退出。正是这个 wait() 举措来让子进程的残留物消逝。
自然的,在上述规矩之外有个例外:父进程可以疏忽 SIGCLD 软中止而不用要 wait()。可以这样做到(在支撑它的体系上,比方Linux):
main()
{
signal(SIGCLD, SIG_IGN); /* now I don’t have to wait()! */
.
.
fork();
fork();
fork(); /* Rabbits, rabbits, rabbits! */
}
如今,子进程死亡时父进程没有 wait(),通罕用 ps 可以看到它被显示为“”。它将永远维持这样 直到 父进程 wait(),或许按以下方法处理。
这里是你必需晓得的另一个规矩:当父进程在它wait()子进程之前死亡了(假如它没有疏忽 SIGCLD),子进程将把 init(pid1)进程作为它的父进程。假如子进程工作得很好并可以掌握,这并不是问题。但假如子进程已经是defunct,咱们就有了一点小费事。看,原先的父进程不可以再 wait(),因为它已经灭亡了。这样,init 怎么晓得 wait() 这些zombie 进程。
答案:不可预感的。在一些体系上,init周期性的损坏掉它一切的defunct进程。在另外一些体系中,它干脆拒绝成为任何defunct进程的父进程,而是立刻消灭它们。假如你运用上述体系的一种,可以写一个简单的循环,用属于init的defunct进程填满进程表。这大约不会令你的体系管理员很愉快吧?
你的义务:肯定你的父进程不要疏忽 SIGCLD,也不要 wait() 它 fork() 的一切进程。不过,你也未必 要总是这样做(比方,你要起一个 daemon 或是别的什么货色),然而你必需警惕编程,假如你是一个 fork()的老手。另外,也不要在心理上有任何约束。
总结:
子进程成为 defunct 直到父进程 wait(),除非父进程疏忽了 SIGCLD 。
更进一步,父进程没有 wait() 就灭亡(仍假如父进程没有疏忽 SIGCLD )的子进程(运动的或许 defunct)成为 init 的子进程,init 用重手段处理它们。