linux中的进程代表着处于执行期的程序以及它所管理资源的总称,因此,进程与程序是两码事,task_str是linux内核的一种数据结构,会被装载到RAM里并且包含着进程的信息,linux中每一个进程都由一个task_struct结构体来定义,即我们所说的PCB,是对进程控制的唯一有效手段,了解task_struct的结构是非常有用的,每一个进程都把它的信息放到task_struct这个数据结构里,task_struct包含以下内容:
(1)进程状态:记录进程在等待、运行或死锁
(2)进程标识符:描述本进程的唯一标识符,用来区别其他进程
(3)优先级:相对于其他进程的优先级
(4)程序计数器:程序中即将被执行的下一条指令的地址
(5)内存指针:包含程序代码和进程相关数据的指针,还有其他进程共享的内存块的指针
(6)上下文数据:进程执行时处理器的寄存器中的数据
(7)I/0状态信息:包含显示的I/0请求,分配给I/0设备和被进程使用的文件列表
(8)记账信息:包含处理器的时间总和,使用的时钟数总和,时间限制,记账号等;
保存进程信息的数据结构叫做task_struct,并且可以在include/linux/sched.h里找到它,所有运行在系统里的进程都以task_struct链表的形式存在内核里;
可通过ps aux[axj] | grep 进程id 查看进程信息
下面给出task_struct中的部分成员介绍:
1.调度数据成员
(1)volatile long states;(表示进程当前状态)
TASK_RUNNING(就绪):正在运行或在就绪队列中准备运行的进程
TASK_INTERRUPTIBLE(浅度睡眠):处于等待队列中的进程,资源有效时唤醒,也可由其它进程通过信号或定时中断唤醒后进入就绪队列
TASK_UNINTERRUPTIBLE(深度睡眠):处于等待队列中的进程,资源有效时唤醒,不可由其它进程通过信号或定时中断唤醒
TASK_STOPPED(暂停):进程被暂停,原因有二,一是对收到SIGSTOP、SIGSTP、SIGTTIN或SIGTTOU信号的反应,二是受其它进程的ptrace系统调用的控制而暂时将 CPU交给控制进程
TASK_ZOMBIE(僵死):表示进程结束但尚未消亡的一种状态(僵死状态),进程已结束运行且释放大部分资源,但尚未释放进程控制块
TASK_SWAPPING:进程页面被交换出内存的进程
(2)unsigned long flags;(进程标志)
PF_PTRACED:被ptrace系统调用监控
PF_TRACESYS:正在跟踪
PF_FORKNOEXEC:进程刚创建,但还未执行
PF_SUPERPRIV:超级用户特权
PF_SIGNALED:进程被信号(signal)杀死
PF_STARTING:进程正被创建
PF_EXITING:进程开始关闭
(3) long priority;(进程优先级)
Priority的值给出进程每次获取CPU后可使用的时间(按jiffies计),优先级可通过系统调用sys_setpriorty改变(在 kernel/sys.c中);
(4)unsigned long rt_priority;(实时进程的优先级)
rt_priority+1000给出进程每次获取CPU后可使用的时间(同样按jiffies计),实时进程的优先级可通过系统 调用sys_sched_setscheduler()改变(见kernel/sched.c);
(5)long counter;(在 轮转法调度时表示进程当前还可运行多久)
在进程开始运行是被赋为priority的值,以后每隔一个tick(时钟中断)递减1,减到0时引起新一轮调 度,重新调度将从run_queue队列选出counter值最大的就绪进程并给予CPU使用权,因此counter起到了进程的动态优先级的作用 (priority则是静态优先级);
(6) unsigned long policy;(进程的进程调度策略)
可以通过系统调用sys_sched_setscheduler()更改(见kernel/sched.c);
调度策略有:
SCHED_OTHER 0 非实时进程,基于优先权的轮转法(round robin)
SCHED_FIFO 1 实时进程,用先进先出算法。
SCHED_RR 2 实时进程,用基于优先权的轮转法。
2.进程队列指针
(1)struct task_struct *next_task,*prev_task;
所有进程(以PCB的形式)组成一个双向链表。next_task和就是链表的前后指针。链表的头和尾都是init_task(即0号进程);
(2)struct task_struct *next_run,*prev_run;
由正在运行或是可以运行的,其进程状态均为TASK_RUNNING的进程所组成的一个双向循环链表,即run_queue就绪队列。该链表的前后向指针用next_run和prev_run,链表的头和尾都是init_task(即0号进程);
(3)struct task_struct *p_opptr,*p_pptr;和struct task_struct *p_cptr,*p_ysptr,*p_osptr;
以上分别是指向原始父进程(original parent)、父进程(parent)、子进程(youngest child)及新老兄弟进程(younger sibling,older sibling)的指针;
3.进程标识符
int pid /pgrp/session :进程标识号、进程组织号以及sessio标识号
unsigned short uid/euid/gid/egid :运行进程的实际用户、有效用户、实际用户组、有效用户组
unsigned short fsuid/fsgid :文件系统的uid、gid,用于文件系统操作时的合法性检查
unsigned short suid/sgid :在系统调用改变uid和gid时,用于保留真正的uid和gid;
int leader :是否是session的主管,为布尔量
4.时间数据成员
(1)unsigned long timeout;(用于软件定时):指出进程间隔多久被重新唤醒
(2)unsigned long it_real_value,it_real_iner;
用 于itimer(interval timer)软件定时。采用jiffies为单位,每个tick使it_real_value减到0时向进程发信号SIGALRM,并重新置初值,初值由 it_real_incr保存;
(3)struct timer_list real_timer;
一种定时器结构(Linux共有两种定时器结构,另一种称作old_timer),数据结构的定义在include/linux/timer.h中;
(4) unsigned long it_virt_value,it_virt_incr;
关 于进程用户态执行时间的itimer软件定时。采用jiffies为单位。进程在用户态运行时,每个tick使it_virt_value减1,减到0时 向进程发信号SIGVTALRM,并重新置初值,初值由it_virt_incr保存;
(5) unsigned long it_prof_value,it_prof_incr;
同样是 itimer软件定时,采用jiffies为单位,不管进程在用户态或内核态运行,每个tick使it_prof_value减1,减到0时向进程发信号 SIGPROF,并重新置初值,初值由it_prof_incr保存;
(6)long utime,stime,cutime,cstime,start_time;
以上分别为进程在用户态的运行时间、进程在内核态的运行时间、所有层次子进程在用户态的运行时间总和、所有层次子进程在核心态的运行时间总和,以及创建该进程的时间;
5.信号量数据成员
(1)struct sem_undo *semundo;
进程每操作一次信号量,都生成一个对此次操作的undo操作,它由sem_undo结构描述。这些属于同一进程的undo操作组成的链表就由semundo 属性指示。当进程异常终止时,系统会调用undo操作。sem_undo的成员semadj指向一个数据数组,表示各次undo的量。结构定义在 include/linux/sem.h。
(2)struct sem_queue *semsleeping;
每一信号量集合对应一 个sem_queue等待队列(见include/linux/sem.h)。进程因操作该信号量集合而阻塞时,它被挂到semsleeping指示的关 于该信号量集合的sem_queue队列。反过来,semsleeping。sleeper指向该进程的PCB。
6.进程上下文环境(重要)
(1)struct desc_struct *ldt;
进程关于CPU段式存储管理的局部描述符表的指针,用于仿真WINE Windows的程序,其他情况下取值NULL,进程的ldt就是arch/i386/traps.c定义的default_ldt;
(2)struct thread_struct tss;
任务状态段,其内容与INTEL CPU的TSS对应,如各种通用寄存器.CPU调度时,当前运行进程的TSS保存到PCB的tss,新选中进程的tss内容复制到CPU的TSS,结构定义在include/linux/tasks.h中;
(3)unsigned long saved_kernel_stack;
为MS-DOS的仿真程序(或叫系统调用vm86)保存的堆栈指针;
(4)unsigned long kernel_stack_page;
在内核态运行时,每个进程都有一个内核堆栈,其基地址就保存在kernel_stack_page中。
内核运行在最高级别(内核态),这个级别可以进行所有操作,而应用程序运行在较低级别(用户态),在这个级别,处理器控制着对硬件的直接访问以及对内存的非授权访问。内核态和用户态有自己的内存映射,即自己的地址空间。
进程上下文:一个进程在执行的时候,CPU的所有寄存器中的值、进程的状态以及堆栈中的内容,当内核需要切换到另一个进程时,它需要保存当前进程的所有状态,即保存当前进程的进程上下文,以便再次执行该进程时,能够恢复切换时的状态,继续执行。
中断上下文:硬件通过触发信号,导致内核调用中断处理程序,进入内核空间。这个过程中,硬件的一些变量和参数也要传递给内核,内核通过这些参数进行中断处理,中断上下文就可以理解为硬件传递过来的这些参数和内核需要保存的一些环境,主要是被中断的进程的环境。
Linux内核工作在进程上下文或者中断上下文。提供系统调用服务的内核代码代表发起系统调用的应用程序运行在进程上下文;另一方面,中断处理程序,异步运行在中断上下文。中断上下文和特定进程无关。
运行在进程上下文的内核代码是可以被抢占的(Linux2.6支持抢占)。但是一个中断上下文,通常都会始终占有CPU,不可以被打断。正因为如此,运行在中断上下文的代码就要受一些限制(不能做的事情):
(1)睡眠或者放弃CPU
这样做的后果是灾难性的,因为内核在进入中断之前会关闭进程调度,一旦睡眠或者放弃CPU,这时内核无法调度别的进程来执行,系统就会死掉
(2)尝试获得信号量
如果获得不到信号量,代码就会睡眠,会产生和上面相同的情况
(3)执行耗时的任务
中断处理应该尽可能快,因为内核要响应大量服务和请求,中断上下文占用CPU时间太长会严重影响系统功能。
(4)访问用户空间的虚拟地址
因为中断上下文是和特定进程无关的,它是内核代表硬件运行在内核空间,所以在中断上下文无法访问用户空间的虚拟地址
7.文件系统数据成员
(1)struct fs_struct *fs;fs 保存了进程本身与VFS的关系消息,其中root指向根目录结点,pwd指向当前目录结点,umask给出新建文件的访问模式(可由系统调用umask更 改),count是Linux保留的属性,如下页图所示。结构定义在include/linux/sched.h中;
(2)struct files_struct *files;
files包含了进程当前所打开的文件(struct file *fd[NR_OPEN]),在Linux中,一个进程最多只能同时打开NR_OPEN个文件,而且,前三项分别预先设置为标准输入、标准输出和出错消息输出文件;
(3)int link_count;
文件链(link)的数目;
8.内存数据成员
struct mm_struct *mm;
在linux 中,采用按需分页的策略解决进程的内存需求。task_struct的数据成员mm指向关于存储管理的mm_struct结构。其中包含了一个虚存队列 mmap,指向由若干vm_area_struct描述的虚存块。同时,为了加快访问速度,mm中的mmap_avl维护了一个AVL树。在树中,所有的 vm_area_struct虚存块均由左指针指向相邻的低虚存块,右指针指向相邻的高虚存块。 结构定义在include/linux/sched.h中。
9.其它数据成员
(1)unsigned short used_math; :是否使用FPU
(2)char comm[16];:进程正在运行的可执行文件的文件名
(3)struct rlimit rlim[RLIM_NLIMITS];
结构rlimit用于资源管理,定义在linux/include/linux/resource.h中,成员共有两项:rlim_cur是资源的当前最大 数目;rlim_max是资源可有的最大数目,在i386环境中,受控资源共有RLIM_NLIMITS项,即10项,定义在 linux/include/asm/resource.h中;
(4)int errno;:最后一次出错的系统调用的错误号,0表示无错误,系统调用返回时,全程量也拥有该错误;
(5)long debugreg[8];:保存INTEL CPU调试寄存器的值,在ptrace系统调用中使用;
(6)struct exec_domain *exec_domain;
Linux可以运行由80386平台其它UNIX操作系统生成的符合iBCS2标准的程序,关于此类程序与Linux程序差异的消息就由 exec_domain结构保存;
(7)unsigned long personality;
Linux 可以运行由80386平台其它UNIX操作系统生成的符合iBCS2标准的程序,Personality进一步描述进程执行的程序属于何种UNIX平台的“个性”信息,通常有PER_Linux、PER_Linux_32BIT、 PER_Linux_EM86、PER_SVR3、PER_SCOSVR3、PER_WYSEV386、PER_ISCR4、PER_BSD、 PER_XENIX和PER_MASK等,参见include/linux/personality.h;
(8)struct linux_binfmt *binfmt;
指向进程所属的全局执行文件格式结构,共有a,out、script、elf和Java等四种,结构定义在include/linux /binfmts.h中(core_dump、load_shlib(fd)、load_binary、use_count);
(9)int exit_code,exit_signal;:引起进程退出的返回代码exit_code,引起错误的信号名exit_signal;
(10)int dumpable:1;:布尔量,表示出错时是否可以进行memory dump;
(11)int did_exec:1;:按POSIX要求设计的布尔量,区分进程是正在执行老程序代码,还是在执行execve装入的新代码;
(12)int tty_old_pgrp;:进程显示终端所在的组标识;
(13)struct tty_struct *tty;:指向进程所在的显示终端的信息,如果进程不需要显示终端,如0号进程,则该指针为空,结构定义在include/linux/tty.h中;
(14) struct wait_queue *wait_chldexit;:在进程结束时,或发出系统调用wait4后,为了等待子进程的结束,而将自己(父进程)睡眠在该队列上。结构定义在include/linux /wait.h中;
10.进程队列的全局变量
(1)current;:当前正在运行的进程的指针,在SMP中则指向CPU组中正被调度的CPU的当前进程:
#define current(0+current_set[smp_processor_id()])/*sched.h*/
struct task_struct *current_set[NR_CPUS];
(2)struct task_struct init_task;:即0号进程的PCB,是进程的“根”,始终保持初值INIT_TASK;
(3)struct task_struct *task[NR_TASKS];
进 程队列数组,规定系统可同时运行的最大进程数(见kernel/sched.c),NR_TASKS定义在include/linux/tasks.h 中,值为512,每个进程占一个数组元素(元素的下标不一定就是进程的pid),task[0]必须指向init_task(0号进程),可以通过 task[]数组遍历所有进程的PCB,但Linux也提供一个宏定义for_each_task()(见 include/linux/sched.h),它通过next_task遍历所有进程的PCB: #define for_each_task(p) \
for(p=&init_task;(p=p->next_task)!=&init_task;)
(4) unsigned long volatile jiffies;:Linux的基准时间(见kernal/sched.c),系统初始化时清0,以后每隔10ms由时钟中断服务程序do_timer()增1;
(5)int need_resched;
重新调度标志位(见kernal/sched.c),当需要Linux调度时置位,在系统调用返回前(或者其它情形下),判断该标志是否置位,置位的话,马上调用schedule进行CPU调度;
(6)unsigned long intr_count;
记录中断服务程序的嵌套层数(见kernal/softirq.c),正常运行时,intr_count为0,当处理硬件中断、执行任务队列中的任务或者执 行bottom half队列中的任务时,intr_count非0,这时,内核禁止某些操作,例如不允许重新调度;