操作系统分析与设计

news/2024/7/20 14:43:30 标签: 操作系统, 数据结构与算法, 内存管理

 

        Linux进程通过一个task_struct结构体描述,在linux/sched.h中定义,通过理解该结构,可更清楚的理解linux进程模型。

 

    包含进程所有信息的task_struct数据结构是比较庞大的,但是该数据结构本身并不复杂,我们将它的所有域按其功能可做如下划分:<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

·   进程状态(State

·   进程调度信息(Scheduling Information

·   各种标识符(Identifiers

·   进程通信有关信息(IPCInter_Process Communication

·   时间和定时器信息(Times and Timers

·   进程链接信息(Links

·   文件系统信息(File System

·   虚拟内存信息(Virtual Memory

·   页面管理信息(page

·   对称多处理器(SMP)信息

·   和处理器相关的环境(上下文)信息(Processor Specific Context

·   其它信息

 

  task_struct结构描述分析(选自操作系统作业)

 

 1 进程状态(State

 

进程执行时,它会根据具体情况改变状态。进程状态是调度和对换的依据。Linux中的进程主要有如下状态,如表3.1所示。

 

3.1  Linux进程的状态

内核表示

含义

TASK_RUNNING

可运行

TASK_INTERRUPTIBLE

可中断的等待状态

TASK_UNINTERRUPTIBLE

不可中断的等待状态

TASK_ZOMBIE

僵死

TASK_STOPPED

暂停

TASK_SWAPPING

换入/换出

 

·   可运行状态:处于这种状态的进程,要么正在运行、要么正准备运行。正在运行的进程就是当前进程(由current所指向的进程),而准备运行的进程只要得到CPU就可以立即投入运行,CPU是这些进程唯一等待的系统资源。

·   等待状态:处于该状态的进程正在等待某个事件(event)或某个资源,它肯定位于系统中的某个等待队列(wait_queue)中。

·   暂停状态:此时的进程暂时停止运行来接受某种特殊处理。通常当进程接收到SIGSTOPSIGTSTPSIGTTIN SIGTTOU信号后就处于这种状态。例如,正接受调试的进程就处于这种状态。

·   僵死状态:进程虽然已经终止,但由于某种原因,父进程还没有执行wait()系统调用,终止进程的信息也还没有回收。顾名思义,处于该状态的进程就是死进程,这种进程实际上是系统中的垃圾,必须进行相应处理以释放其占用的资源。

 

2 进程调度信息

 

调度程序利用这部分信息决定系统中哪个进程最应该运行,并结合进程的状态信息保证系统运转的公平和高效。这一部分信息通常包括进程的类别(普通进程还是实时进程)、进程的优先级等。表3.2描述了跟进程调度有关的字段,表3.3说明了几种常用的进程调度算法及这些算法的使用范围,如先来先服务主要用于实时进程的调度。

 

 

3.2 进程调度信息

域名

含义

need_resched

调度标志

Nice

静态优先级

Counter

动态优先级

Policy

调度策略

rt_priority

实时优先级

 

3.3  进程调度的策略

名称

解释

适用范围

SCHED_OTHER

其他调度

普通进程

SCHED_FIFO

先来先服务调度

实时进程

SCHED_RR

时间片轮转调度

 

只有root用户能通过sched_setscheduler()系统调用来改变调度策略。

 

3 标识符(Identifiers

 

每个进程有进程标识符、用户标识符、组标识符,如表3.4所示。

不管对内核还是普通用户来说,怎么用一种简单的方式识别不同的进程呢?这就引入了进程标识符(PIDprocess identifier),每个进程都有一个唯一的标识符,内核通过这个标识符来识别不同的进程,同时,进程标识符PID也是内核提供给用户程序的接口,用户程序通过PID对进程发号施令。PID32位的无符号整数,它被顺序编号:新创建进程的PID通常是前一个进程的PID1。然而,为了与16位硬件平台的传统Linux系统保持兼容,在Linux上允许的最大PID号是32767,当内核在系统中创建第32768个进程时,就必须重新开始使用已闲置的PID号。

3.4 各种标识符

域名

含义

Pid

进程标识符

Uidgid

用户标识符、组标识符

Euidegid

有效用户标识符、有效组标识符

Suidsgid

备份用户标识符、备份组标识符

Fsuidfsgid

文件系统用户标识符、文件系统组标识符

 

4 进程通信有关信息(IPCInter_Process Communication

 

为了使进程能在同一项任务上协调工作,进程之间必须能进行通信即交流数据。

Linux支持多种不同形式的通信机制。它支持典型的Unix 通信机制(IPC Mechanisms):信号(Signals)、管道(Pipes),也支持System V 通信机制:共享内存(Shared Memory)、信号量和消息队列(Message Queues,如表3.5

 

3.5 进程通信有关信息

域名

含义

Spinlock_t sigmask_lock

信号掩码的自旋锁

Long blocked

信号掩码

Struct signal  *sig

信号处理函数

Struct sem_undo *semundo

为避免死锁而在信号量上设置的取消操作

Struct sem_queue *semsleeping

与信号量操作相关的等待队列

 

5 进程链接信息(Links

 

程序创建的进程具有父/子关系。因为一个进程能创建几个子进程,而子进程之间有兄弟关系,在task_struct结构中有几个域来表示这种关系。

Linux系统中,除了初始化进程init,其他进程都有一个父进程(parent process)或称为双亲进程。可以通过fork()或clone()系统调用来创建子进程,除了进程标识符(PID)等必要的信息外,子进程的task_struct结构中的绝大部分的信息都是从父进程中拷贝,或说“克隆”过来的。系统有必要记录这种“亲属”关系,使进程之间的协作更加方便,例如父进程给子进程发送杀死(kill)信号、父子进程通信等,就可以用这种关系很方便地实现。

每个进程的task_struct结构有许多指针,通过这些指针,系统中所有进程的task_struct结构就构成了一棵进程树,这棵进程树的根就是初始化进程inittask_struct结构(init进程是Linux内核建立起来后人为创建的一个进程,是所有进程的祖先进程)。表3.6是进程所有的链接信息。

 

3.6 进程链接信息

名称

解释 [指向哪个进程]

p_opptr

祖先

p_pptr

父进程

p_cptr

子进程

p_ysptr

弟进程

p_osptr

兄进程

Pidhash_next

Pidhash_pprev

进程在哈希表中的链接

Next_task

prev_task

进程在双向循环链表中的链接

Run_list

运行队列的链表

 

时间和定时器信息(Times and Timers

 

一个进程从创建到终止叫做该进程的生存期(lifetime)。进程在其生存期内使用CPU的时间,内核都要进行记录,以便进行统计、计费等有关操作。进程耗费CPU的时间由两部分组成:一是在用户模式(或称为用户态)下耗费的时间、一是在系统模式(或称为系统态)下耗费的时间。每个时钟滴答,也就是每个时钟中断,内核都要更新当前进程耗费CPU的时间信息。

3.7是和时间有关的域,上面所说的counter是指进程剩余的CPU时间片,也和时间有关,所以这里我们再次提及它。表3.8是进程的所有定时器。

3.7与时间有关的域

域名

含义

Start_time

进程创建时间

Per_cpu_utime

进程在某个CPU上运行时在用户态下耗费的时间

Per_cpu_stime

进程在某个CPU上运行时在系统态下耗费的时间

Counter

进程剩余的时间片

 

3.8  进程的所有定时器

定时器类型

解释

什么时候更新

用来表示此种定时器的域

ITIMER_REAL

实时定时器

实时更新,即不论该进程是否运行

it_real_value

it_real_incr

real_timer

ITIMER_VIRTUAL

虚拟定时器

只在进程运行于用户态时更新

it_virt_value

it_virt_incr

ITIMER_PROF

概况定时器

进程运行于用户态和系统态时更新

it_prof_value

it_prof_incr

 

文件系统信息(File System

 

进程可以打开或关闭文件,文件属于系统资源,Linux内核要对进程使用文件的情况进行记录。task_struct结构中有两个数据结构用于描述进程与文件相关的信息。其中,fs_struct中描述了两个VFS索引节点(VFS inode),这两个索引节点叫做rootpwd,分别指向进程的可执行映象所对应的根目录(home directory)和当前目录或工作目录。file_struct结构用来记录了进程打开的文件的描述符(descriptor)。如表3.9所示。

 

 

3.9  与文件系统相关的域

定义形式

解释

Sruct fs_struct *fs

进程的可执行映象所在的文件系统

Struct files_struct *files

进程打开的文件

 

在文件系统中,每个VFS索引节点唯一描述一个文件或目录,同时该节点也是向更低层的文件系统提供的统一的接口。

 

8 虚拟内存信息(Virtual Memory

 

除了内核线程(kernel thread),每个进程都拥有自己的地址空间(也叫虚拟空间),用mm_struct来描述。另外Linux2.4还引入了另外一个域active_mm,这是为内核线程而引入。因为内核线程没有自己的地址空间,为了让内核线程与普通进程具有统一的上下文切换方式,当内核线程进行上下文切换时,让切换进来的线程的active_mm 指向刚被调度出去的进程的active_mm(如果进程的mm域不为空,则其active_mm域与mm域相同)。内存信息如表3.10所示。

3.10   虚拟内存描述信息

定义形式

解释

Struct mm_struct *mm

描述进程的地址空间

Struct mm_struct *active_mm

内核线程所借用的地址空间

 

页面管理信息

 

   当物理内存不足时,Linux内存管理子系统需要把内存中的部分页面交换到外存,其交换是以页为单位的。有关页面的描述信息如表3.11

 

3.11 页面管理信息

  定义形式

解释

Int swappable

进程占用的内存页面是否可换出

Unsigned long min_flat,

maj_flt,nswap

进程累计的次(minor)缺页次数、

(major)次数及累计换出、换入页面数

Unsigned long cmin_flat,

cmaj_flt,cnswap

本进程作为祖先进程,其所有层次子进程的累计的次(minor)缺页次数、主(major)次数及累计换出、换入页面数

 

 

10 进程内核栈及current

 

Linux-2.6内核中堆栈这么定义:
union thread_union {
      struct thread_info thread_info;
      unsigned long stack[THREAD_SIZE/sizeof(long)];
};

    根据内核的配置,THREAD_SIZE既可以是4K字节(1个页面)也可以是8K字节(2个页面)thread_info52个字节长。图3.1是当设为8KB时候的内核堆栈:Thread_info在这个内存区的开始处,内核堆栈从末端向下增长。进程描述符不是在这个内存区中,而分别通过taskthread_info指针使thread_info与进程描述符互联。所以获得当前进程描述符的current定义如下:


100427151002.jpg

<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" />

3.1  linux进程内核栈

 


#define current get_current()
static inline struct task_struct * get_current(void)
{
      return current_thread_info()->task;
}
static inline struct thread_info *current_thread_info(void)
{
       struct thread_info *ti;
       __asm__("andl %%esp,%0; ":"=r" (ti) : "" (~(THREAD_SIZE - 1)));
       return ti;
}
    根据THREAD_SIZE大小,分别屏蔽掉内核栈的12-bit LSB(4K)13-bit LSB(8K),从而获得内核栈的起始位置,及当前进程描述符的指针。


转载于:https://www.cnblogs.com/yunnotes/archive/2013/04/19/3032480.html


http://www.niftyadmin.cn/n/1795249.html

相关文章

simvision使用

Access Design Source Code&#xff1a; 1)通过file---open来打开&#xff0c; 2)通过send to source viewer来看&#xff0c; 双击信号&#xff0c;进行driver的trace&#xff0c;显示在左侧的driver/load tab或者直接转到下一个scope的source code file 查找&#xff1a; 1)右…

在slim文件夹训练过程报错解决说明

Tensorflow报错 方法一&#xff1a; 在控制台运行一下代码slim中&#xff1a;出现以下运行错误 python train_image_classifier.py \ --train_dirsatellite/train_dir \ --dataset_namesatellite \ --dataset_split_nametrain \ --dataset_dirsatellite/data \ --model_name…

安装 ubuntu 16.04

上一篇文章简单介绍了下 ubuntu 的文件结构系统&#xff0c;这边文章将记录我安装的过程&#xff0c;由于安装过程中没有截图&#xff0c;所以本文的图片都来源网络。 1 制作 Ubuntu 16.04 LTS U 盘启动盘 (1) 到官网到下载 Ubuntu 16.04 LTS系统安装镜像 https://www.ubuntu.c…

Ext2文件恢复实例分析

为了使问题简单化&#xff0c;在根目录下创建文件dnfs-server.conf&#xff0c;由于根目录的inode节点为2&#xff08;ls –i –l –d /&#xff09;&#xff0c;且第一个块组的inode table起始块号为483&#xff09;&#xff0c;查看根目录的索引节点信息。 &#xff08;参考h…

采用imageNet制作自己的数据并进行训练

采用ImageNet方法制作自己的数据进行训练分类器 第一步&#xff1a;数据制作 本篇以红绿灯数据样本为案例&#xff0c;讲解如何自作自己的数据训练样本。 首先收集红绿灯三个样本数据集&#xff0c;关于如何收集这里不做重点讲解&#xff0c;网上可以各种下载相应的图片&#…

NPOI 导出Excel2007版本时出现流已关闭问题

NPOI生产.xlsx文件件时&#xff0c;在使用book.Write(ms);后&#xff0c;会关闭流&#xff0c;这样导致再次使用Respons输出流的时候就出错了。 我看到一些网友提供的解决办法是&#xff1a; public class NPOIMemoryStream:MemoryStream{/// <summary>/// 获取流是否关闭…

复制互联网2011

趁着京东商城做活动&#xff0c;买了几本一直想看的书&#xff0c;其中包括《复制互联网-2011年全球最值得模仿的100个网站》&#xff0c;虽然网易科技有“每日一站”专栏&#xff0c;但我还是想买本书收藏一下。 本书主要从“web 2.0网站”&#xff0c;“搜索引擎”&#xff0…

将图片转换成tfrecord格式说明

遇到问题一&#xff1a;utf-8 codec cant decode byte 0xff in position 0: invalid start byte 参考网址&#xff1a;https://blog.csdn.net/ptgood/article/details/79947011 tensorflow - Inception build_imagenet_data.py TypeError: RGB has type <class str>, bu…