『 Linux 』使用fork函数创建进程与进程状态的查看(下)

简介: 『 Linux 』使用fork函数创建进程与进程状态的查看(下)

『 Linux 』使用fork函数创建进程与进程状态的查看(上)https://developer.aliyun.com/article/1424455


🖥️ 通过系统调用创建子进程 fork() 🖥️

unistd.h头文件中,还包含了一个函数pid_t fork();

该函数可以在当前进程中创建子进程;

而该函数的返回值分为三种:

  • 当该函数创建子进程失败则返回-1;
  • 当该进程为父进程时,该函数的返回值为子进程的PID;
  • 当该进程为子进程时,该函数的返回值为0;

示例:

#include<iostream>
#include<unistd.h>
using namespace std;
void test2(){
  cout<<"it'a test"<<endl;
  fork();
  cout<<"hello world"<<endl;
}
int main()
{
  test2();
  return 0;
}

当运行这段程序后所得的结果为:

$ ./myproc 
it'a test
hello world
hello world

本质上的原因是因为这个函数创建了子进程,而父子进程中代码是共享的,所以第一句代码只执行了一次,而fork()之后创建了子进程,第二句代码执行了两次的原因;


💻 那么为什么在fork()函数当中有两个返回值;

这里可以将fork()函数的内部看成两种代码,分别是最后的返回以及其他代码;

pid_t fork(){
    pid_t ret;
    //其他代码,主要用于创建子进程
    return ret;
}

从这里可以推断出,当该函数即将结束时,也就是在函数返回之前,其核心操作(创建子进程)已经结束;

当子进程被创建后代表将会多一个执行流用于最后一步的return;

实际上在操作系统当中,会为每个CPU准备一个对应的运行队列,其中这个运行队列当中的各个节点就相当于一个pcb结构体,同时这个节点中还存储着其对应的代码及数据;

当一个进程被运行时将会被操作系统加载到该CPU的运行队列中,而CPU采用分时多任务的方式对这些进程进行操作;

进程结束时这个进程将会被操作系统从运行队列中移出;

同时当子进程被创建之后将多一条执行流,而在接下来的代码当中是父进程先执行还是子进程先执行这是由操作系统的调度器来决定的;

在操作系统中不单单只有运行队列,在整体中CPU能算是一种资源,但是这个资源并不属于单单的一个进程,而是多个进程共用的;

对于其他的资源来说不同的资源都有着对应的队列(就绪队列,阻塞队列等),各个进程通过加载进对应的队列来实现对计算机当中各个资源的使用;


🔋 创建子进程后分区工作 🔋

在使用fork()创建子进程后子进程与父进程都将共享代码,那么在共享代码的前提下如何使得创建子进程后提高整体效率?

从上文可知,该函数在创建子进程时将有三种返回值,即>0父进程,==0子进程,<0创建进程失败;

可以在程序中使用分支语句根据不同的条件使得不同的进程来完成不同的工作;

示例:

#include<iostream>
#include<unistd.h>
using namespace std;
void test3(){
  pid_t ret = fork();
  if(ret<0) cerr<<"fork fail"<<endl;
  if(ret==0) while(1){
    cout<<"子进程 ret:"<<ret<<"  PID: "<<getpid()<<"  PPID: "<<getppid()<<endl;
  sleep(1);
  }
  if(ret>0)while(1){
    cout<<"父进程 ret:"<<ret<<"  PID: "<<getpid()<<"  PPID: "<<getppid()<<endl;
  sleep(1);
  }
}
int main()
{
  test3();
  return 0;
}

在该段代码中,使用了if分支语句将子进程与父进程进行分流工作从而达到子进程与父进程不无意义的重复同一项工作;

##结果
子进程 ret:0  PID: 13412  PPID: 13411
父进程 ret:13412  PID: 13411  PPID: 13265
子进程 ret:0  PID: 13412  PPID: 13411
父进程 ret:13412  PID: 13411  PPID: 13265

🖥️ 进程状态 🖥️

在操作系统中,进程也被称作为任务,而一个任务他的状态不一定是持续的;同时在操作系统中进程拥有多种状态,称之为进程状态;


💻 操作系统的进程状态

在操作系统中常见的进程状态有几种:

  • 新建状态
    当一个进程正在被创建时,操作系统将会为其分配系统资源,并初始化该进程对应的PCB结构体;

  • 运行状态
    当一个进程已经被加载至运行队列当中,这个进程即为运行态,进程的运行态并不代表这个进程将一直占用这个CPU,会以一种分时多任务的方式将CPU逐个分配运行队列中的各个进程,同时在这个时候,进程拥有了CPU资源和其他的所需资源;


  • 就绪状态
    当一个进程已经被创建,且已经分配好了其他资源,但操作系统还并未给该进程分配CPU资源,即该进程并未被加载至运行队列当中称之为就绪状态;

  • 阻塞状态
    当一个进程既没有CPU资源也没有其他所需资源时称之为阻塞状态;举一个例子:当一个进程原本在运行队列当中,但是这个进程中的某段代码需要去访问除了CPU外的其他资源(例如输入输出设备或者是其他设备时),这个进程将会从原本的运行队列加载至其他队列,这个队列就称之为阻塞队列,此时这个进程的状态就称之为阻塞状态;

即等待非CPU资源就绪称之为阻塞状态(调用cin但不输入数据);


  • 挂起状态
    相比于其他状态来说,挂起状态与CPU并没有太直接的关系;在计算机的磁盘当中,存在着一个swap分区,这个分区就是为了当内存不足时使进程状态转化为挂起状态而准备的;
    从上面可以知道,在队列当中的进程不仅仅是PCB结构体,由于各个进程要通过使用资源来操作自身的代码及数据可以得知一个进程中除了PCB结构体以外还包含着对应的代码以及数据;而挂起状态即为:
    当内存严重吃紧时,操作系统会将这个进程所对应的代码及数据交换至磁盘中的swap分区从而到达减轻内存的负担,当这个进程对应的代码及数据被交换至swap分区时这个进程即为挂起状态;


  • 阻塞挂起状态
    阻塞挂起状态,顾名思义,就是既是阻塞状态也是挂起状态;
    当一个进程在等待某种资源就绪时称这个进程的状态为阻塞状态,而当这个进程在等待某种资源时内存吃紧,导致该进程的代码与数据被操作系统移至磁盘的swap分区时,称之为阻塞挂起状态;

💻 Linux操作系统下的进程状态

在该处为了查看进程状态我们可以使用shell脚本语言来循环ps axj;

while : ; do ps axj | head -1 && ps axj | grep myproc | grep -v grep; sleep 1; done #其中grep myproc 中的myproc为该进程的关键字
$ while : ; do ps axj | head -1 && ps ajx | grep myproc | grep -v grep ; sleep 2;  done
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND

//状态在kernel源码中的定义
/*
* The task state array is a strange "bitmap" of
* reasons to sleep. Thus "running" is zero, and
* you can test for combinations of others with
* simple bit tests.
*/
static const char * const task_state_array[] = {
"R (running)",    /* 0 */
"S (sleeping)",   /* 1 */
"D (disk sleep)",   /* 2 */
"T (stopped)",    /* 4 */
"t (tracing stop)", /* 8 */
"X (dead)",     /* 16 */
"Z (zombie)",     /* 32 */
};

实际上在Linux中的进程状态在内核中是一个指针数组static const char * const task_state_array[];


🔋 R 运行状态(running) 🔋

运行状态并不意味着该进程一直正在运行当中,当多个进程需要共享即同时使用同一个CPU时将会以分时多任务的方式将该资源分配给多个进程;

就像是打篮球时每个球员对于球的控制都有一定的时间,该在控球时间限制内将球传给另一个球员或者是其他操作;

存在一个程序,其代码为:

void test4(){
  while(1){
    cout<<"hello world"<<endl;
  }
}
int main()
{
  test4();
  return 0;
}

以前面的知识点可以知道当该程序运行时该进程应该为R状态,也就是running运行状态,而当运行这个程序后可以发现;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 16857 16857 13383 pts/2    16857 S+    1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND

当程序运行后发现该状态为S+状态,这是因为该程序当中该处调用了std::cout,意思是在该进程当中将会去调用显示器,而在冯诺依曼体系中显示器属于外设,所以当该进程需要去调用外设时这个进程将从调度队列转移到阻塞队列,所以显示出的状态为S+而不是R;

当代码中的cout<<"hello world"<被注释后代表这个程序不需要调用CPU以外的资源,此时这个程序再次被运行时进程状态将会变成R+;

void test4(){
  while(1){
    //cout<<"hello world"<<endl; //将该行注释
  }
}

进程状态如下:

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 31313 31313 13383 pts/2    31313 R+    1002   0:00 ./myproc

此时的进程状态为R+;

同时该处的R状态对应着操作系统进程概念中的运行状态;


🔋 S 睡眠状态 (sleeping) 🔋

睡眠状态对应的是操作系统进程概念的阻塞状态,当一个进程在等待某种非CPU资源就绪时,称之为睡眠状态;

在测试运行状态的代码中也曾因为调用了外设出现了短暂的sleeping状态;

void test5(){
  int a = 0;
  cin>>a;//调用流提取,表示在运行这个程序时需要等待输入设备输入数据
}
int main()
{
  test5();
  return 0;
}

这段代码使用了流提取,所以需要等待输入设备(键盘)进行输入;

当该程序运行后发现这个进程的状态为S+:

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  2620  2620 13383 pts/2     2620 S+    1002   0:00 ./myproc

但是该进程状态也被称作可中断睡眠(Interruptible sleep);

这里的可中断睡眠的意思即为可以被被动唤醒;

void test6(){
  sleep(1000);//使用sleep使该进程主动睡眠
}
int main()
{
  test6();
  return 0;
}

当运行该程序时其进程的状态为S+ 的状态;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  4437  4437 13383 pts/2     4437 S+    1002   0:00 ./myproc

从这里可以看出该进程的PID为4437;

而在这里若是使用-19信号使该进程被动唤醒;

kill -19 4439
PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  4437  4437 13383 pts/2     4437 S+    1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383  4437  4437 13383 pts/2    13383 T     1002   0:00 ./myproc

该进程的状态由S+转换为T状态,此时该进程的睡眠状态也已被唤醒;


🔋 D 磁盘休眠状态(Disk sleep) 🔋

磁盘睡眠也称作不可中断睡眠状态(uninterruptible sleep),也被称作深度睡眠,顾名思义即不可被被动唤醒;

在绝大多数情况下,磁盘的睡眠状态是可以被唤醒的,那么对于这个所谓的磁盘休眠状态到底是一种什么样的状态?

当一个进程向磁盘读写数据时,若是这个数据量足够大,则这个进程需要在这个资源继续等待;在等待过程中若是该进程被打断,则容易出现磁盘数据与内存数据不一致的问题;

当内存严重吃紧时,操作系统将会选择性的杀死一些等待过长的没有进行有效操作的进程,若是在进程对磁盘进行读写时将该进程杀死则会出现上述问题;

所以当一个进程向磁盘进行读写时,为了保证数据的一致性,在读写结束之前,即该进程得到磁盘的回复之前,该进程都是一种不可被打断的D 磁盘休眠状态;

在这个情况下,即使使用-9号信号也不能将该进程杀死;

本质上来说,这个不可中断睡眠是操作系统对进程和硬件的一种保护机制;

这个状态下的进程通常会等待IO的结束,这里的IO可能是磁盘IO,网络IO,其他外设的IO;


🔋 T(t) 停止、暂停状态(tracing stopped) 🔋

该状态也被称为暂停状态和调试状态,将一个程序以-g的形式编译并使用GDB进行调试,在打断点之后运行该程序,该程序停止时其进程的状态即为t状态;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
 7455  7542  7542 13383 pts/2     7455 t     1002   0:00 /home/root/Begin/my_-linux/Pr o23/Process1107/Test1121/myproc

🔋 T 停止、暂停状态(stopped) 🔋

可以通过发送SIGSTOP信号,即-19号信号停止该进程;

当该进程处于停止状态时,可以通过发送SIGCONT状态使其继续运行;

PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 11260 11260 13383 pts/2    11260 S+    1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 11260 11260 13383 pts/2    13383 T     1002   0:00 ./myproc
 PPID   PID  PGID   SID TTY      TPGID STAT   UID   TIME COMMAND
13383 11260 11260 13383 pts/2    13383 S     1002   0:00 ./myproc

在调试过程中可以理解为当遇到断点时GDB向进程发送SIGSTOP信号从而达到实现暂停进程;


🔋 X 死亡状态(dead) 🔋

当一个进程已经结束(死亡),但操作系统未及时回收该进程的资源时,这个进程称为死亡状态;

在任务列表当中一般看不到这个状态,是因为这个状态的瞬时性太强,同时该状态只是一个返回状态;


🔋 前台进程 🔋

在上述的进程状态描述当中,实际上出现的进程状态中带了一个符号+;

譬如S+,R+等等;

在操作系统当中,一般进程状态中带+的进程也被称作为前台进程;

前台进程占用的是命令行解释器,即当这个进程在运行时对应的终端不能对命令行进行解释;

同时前台进程可以直接使用Ctrl+C来结束;

$ ./myproc 
test
test
test
^C

若是想将该进程变为后台进程,可以在运行该程序时在最后带上一个&符号;

当使用这种方法将进程以后台进程的形式运行时将会为使用者回显一次该进程的PID,方便使用者对该进程进行对应的操作;

同时,使用这种方式之后,进程将不再占用命令行解释器也不能使用Ctrl+C结束,即命令行解释器可以正常使用;



相关文章
|
30天前
|
算法 Linux 调度
深入理解Linux操作系统的进程管理
本文旨在探讨Linux操作系统中的进程管理机制,包括进程的创建、执行、调度和终止等环节。通过对Linux内核中相关模块的分析,揭示其高效的进程管理策略,为开发者提供优化程序性能和资源利用率的参考。
67 1
|
9天前
|
Linux
【Linux】System V信号量详解以及semget()、semctl()和semop()函数讲解
System V信号量的概念及其在Linux中的使用,包括 `semget()`、`semctl()`和 `semop()`函数的具体使用方法。通过实际代码示例,演示了如何创建、初始化和使用信号量进行进程间同步。掌握这些知识,可以有效解决多进程编程中的同步问题,提高程序的可靠性和稳定性。
48 19
|
11天前
|
Linux Android开发 开发者
linux m、mm、mmm函数和make的区别
通过理解和合理使用这些命令,可以更高效地进行项目构建和管理,特别是在复杂的 Android 开发环境中。
41 18
|
19天前
|
存储 监控 Linux
嵌入式Linux系统编程 — 5.3 times、clock函数获取进程时间
在嵌入式Linux系统编程中,`times`和 `clock`函数是获取进程时间的两个重要工具。`times`函数提供了更详细的进程和子进程时间信息,而 `clock`函数则提供了更简单的处理器时间获取方法。根据具体需求选择合适的函数,可以更有效地进行性能分析和资源管理。通过本文的介绍,希望能帮助您更好地理解和使用这两个函数,提高嵌入式系统编程的效率和效果。
84 13
|
26天前
|
SQL 运维 监控
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
南大通用GBase 8a MPP Cluster Linux端SQL进程监控工具
|
1月前
|
运维 监控 Linux
Linux操作系统的守护进程与服务管理深度剖析####
本文作为一篇技术性文章,旨在深入探讨Linux操作系统中守护进程与服务管理的机制、工具及实践策略。不同于传统的摘要概述,本文将以“守护进程的生命周期”为核心线索,串联起Linux服务管理的各个方面,从守护进程的定义与特性出发,逐步深入到Systemd的工作原理、服务单元文件编写、服务状态管理以及故障排查技巧,为读者呈现一幅Linux服务管理的全景图。 ####
|
2月前
|
缓存 算法 Linux
Linux内核的心脏:深入理解进程调度器
本文探讨了Linux操作系统中至关重要的组成部分——进程调度器。通过分析其工作原理、调度算法以及在不同场景下的表现,揭示它是如何高效管理CPU资源,确保系统响应性和公平性的。本文旨在为读者提供一个清晰的视图,了解在多任务环境下,Linux是如何智能地分配处理器时间给各个进程的。
|
2月前
|
网络协议 Linux 虚拟化
如何在 Linux 系统中查看进程的详细信息?
如何在 Linux 系统中查看进程的详细信息?
168 1
|
5月前
|
Linux
Linux0.11 文件打开open函数(五)
Linux0.11 文件打开open函数(五)
59 0
|
8月前
|
Linux 开发者
Linux文件编程(open read write close函数)
通过这些函数,开发者可以在Linux环境下进行文件的读取、写入和管理。 买CN2云服务器,免备案服务器,高防服务器,就选蓝易云。百度搜索:蓝易云
179 4