【Linux】进程理解与学习-程序替换

简介: 【Linux】进程理解与学习-程序替换

前言



在前文,我们学习了fork函数创建子进程,而创建子进程主要就是为了让它帮我们执行特定的任务。而我们之前所学的都只是为了让子进程帮我们执行父进程的部分代码(通过执行流分流的方式),并没有执行一个全新的程序。但实际上子进程也是可以执行一个新的程序。子进程可以通过程序替换的方式将父进程的代码与数据替换成新的程序对应的代码与数据。本文将对此进行探讨。


程序替换



进程可以通过程序替换的方式来执行一个全新的程序,具体的做法则是通过对应的程序替换的几个系统调用函数来实现,下面先来看一下程序替换的现象,根据这个现象来分析程序替换实现的原理。


程序替换的现象


接下来我们通过该现象对此进行分析,现象如下:


1.png


我们可以看到,我们最终的执行结果并不是像我们想象的那样,而是将本该打印的end给替换成了执行ls这个指令。那么具体的原理是怎样的呢?如下图所示:


程序替换的原理


原理图解


2.png


通过上图,也解释了为什么在执行我们的进程时,execl函数后面的end的打印并没有执行,因为在我们执行完打印begin后,开始调用系统调用函数execl,将新的程序(ls)的代码与数据加载到内存对应的位置,将老进程的代码与数据给替换掉,所以就执行不了后面的打印end指令了。(这里注意的是,程序替换是实现的代码与数据的整体替换)


那么这里不仅有一个问题:在进程替换时,有没有产生新的进程呢?


答案是没有的,因为我们仅仅只是将老进程里面的代码与数据,替换成新程序的代码与数据,实现程序替换。并没有产生新的进程。正如上图所示,原进程对应的pcb并没有发生改变,也没有产生新的pcb。


当然我们也可以通过代码来验证一下:


3.png


多进程对应的程序替换


当然,假如我们使用fork创建子进程,让子进程完成程序替换,子进程的程序替换并不会影响父进程,这是因为父子进程都有各自独立的PCB,并且由于写时拷贝机制的存在,使得父子进程互相独立,互不影响。


4.png


程序替换函数


接下来我们讲一下几个程序替换函数。总体一共有7个,其中这七个里的六个实际上底层都是调用第七个。总体如下:


5.png


exec函数家族关系


对于这些exec函数,它们都只具有失败时候的返回值,当程序替换失败时,会返回-1,同时继续往后执行exec后面的指令,当替换成功时会直接执行替换后的新程序。接下来逐一介绍。


execl函数


首先介绍的是execl函数,我们在上面的演示中用到的就是该函数。


int execl(const char *path, const char *arg, ...);

对于该函数来说:


返回值:失败返回-1,替换成功执行新程序。

path参数:新程序的路径位置(找到它)

arg参数:新程序名称(执行它)

...:可变参数,这里表示命令行参数选项(就比如上文所示-a -l),以NULL结尾。

举例:


6.png


execv

int execv(const char *path, char *const argv[]);


该函数我们发现,之前的l变成了v,实际上其实就是用了一个函数指针数组,将之前的"ls","-a","-l"的地址放进数组里,数组最后一位元素为NULL,然后将该指针数组的起始地址(数组名),当作execv的第二个参数。


对于该函数来说:


返回值:替换失败返回-1

path参数:程序所在路径

argv[]:指针数组的地址(数组名)

举例:


7.png


execlp

int execlp(const char *file, const char *arg, ...);


对于该函数,我们发现之前的path参数更换成了file,然后函数名中加了个p,其实代表的意思就是,会在PATH环境变量中根据file名查找file的路径,后面的参数代表的与execl一样。


对于该函数:


返回值:替换失败返回-1

file传程序名,会根据程序名自动在PATH中搜索该程序对应的路径。(找到它,不需要我们传具体的路径,会自动匹配)

后面的arg表示程序名(执行它)

...:可变参数,表示新程序的命令行参数选项(怎么执行,比如:-a -l),以NULL结尾

举例:


8.png


不过这里需要注意的是,自动搜索匹配路径是指在PATH环境变量中搜寻,假如一个新程

序的路径并不在PATH中,则会匹配不上,就导致替换失败。如下:


9.png


程序替换失败


execvp


我们发现,该函数变成了vp结尾,v表示数组(指针数组)的形式,p表示自动搜索匹配环境变量PATH中的路径。


int execvp(const char *file, char *const argv[]);

对于该函数:


返回值:替换失败返回-1

file:程序名,会根据程序名自动搜索在PATH中对应的路径

argv[]:指针数组,用法同execv

举例:


10.png


同样,这里自动匹配路径指的是在PATH中搜索,假如我们想要执行替换自己写的程序,就要将我们写的程序的路径用export导入环境变量即可。


execle


这里的e,表示environ,即表示环境变量表。也就是说,我们可以将当前程序的替换成新程序,同时将老的环境变量表也传给新程序。


int execle(const char *path, const char *arg,
                  ..., char * const envp[]);

对于该函数:


返回值:替换失败返回-1

用法同execl,只是最后加了一个参数,用来传给新程序环境变量表(这个环境变量表可以是自己定义,也可以是系统的)。

当然如果将自定义的环境变量表传给新程序的话,新程序的原有的系统环境变量表就会被覆盖掉。

举例:


11.png


execvpe


我们发现,这里v(数组)、p(PATH)、e(环境变量表),三者都集齐了。  


int execvpe(const char *file, char *const argv[],
                   char *const envp[]);

对于该函数:


返回值:替换失败返回-1

file:会自动根据file匹配PATH中的路径,不需要我们手动写全

argv[]:指针数组

envp[]:环境变量表(可以是系统的,也可以是自定义的)

举例:


newtest程序:


#include<stdio.h>
#include<unistd.h>
#include<stdlib.h>
 int main()
 {
   extern char** environ;
   printf("我是新程序,我的环境变量表中的前三个环境变量是:\n");                                                                               
   for(int i=0;i<3; ++i)
   {
     printf("%d:%s\n",i,environ[i]);
   }
   return 0;
 }

运行newtest:


12.png


mytest程序:实现程序替换(在此之前已经将newtest的路径导入了PATH)


#include<stdio.h>
 #include<unistd.h>
 #include<stdlib.h>
 #include<sys/types.h>
 #include<sys/wait.h>
 #include<fcntl.h>
 int main()
 {
   pid_t id=fork();//创建子进程
   if(id == 0)
   {
     //child
    printf("我是子进程,pid:%d\n",getpid());
    char*const envp[]={"myval=520",NULL};//自定义环境变量表
    const char* argv[]={"newtest",NULL};//指针数组
    execvpe("newtest",argv,envp);//注意:我已经将newtest的路径导进了PATH
    printf("程序替换失败\n");                                                                                                               
    exit(1);
  }
   //father
   int status=0;
   waitpid(id,&status,0);//进程等待
   if(WEXITSTATUS(status)!=1)
   {
     printf("进程替换成功\n");
   }
   return 0;
 }

13.png


已经将新程序路径导入环境变量


14.png


execve

execve为最正宗的系统调用函数,我们这里讲解的其它的系统调用其实底层都是调用了该函数。


int execve(const char *filename, char *const argv[],
                  char *const envp[]);

对于该函数:


替换失败返回-1

参数filename:表示新程序的路径(找到它)

argv[]:指针数组,存放新程序名(执行它),以及程序对应的命令行参数列表(比如ls的-a -l),最后以NULL结束。

envp[]:环境变量表(可自定义),传入环境变量表后,新程序的老的环境变量表就被这里的envp环境变量表给覆盖了。

举例:


15.png


额外补充


对于以上的这么多系统调用函数,可能看了都头大,但是仔细看,其实会有很多共性,可以利用这 个特点来更加巧妙地记住这些函数的用法。


联想记忆exec函数家族:


带有l的:l联想list,所以参数中要带有NULL,就好像一个链表一样。("ls", "-l"," -a"," NULL)

带有v的:v联想vector,说明第二个参数传的是个数组(指针数组)

带有p的:p联想PATH,说明第一个参数不需要我们传具体的路径,只需要传个程序名即可(会自动搜索PATH路径进行匹配)。

带有e的:说明最后一个参数是用来传环境变量表(也可以是自定义的环境变量表)的


相关文章
|
15天前
|
安全 Linux Shell
Linux上执行内存中的脚本和程序
【9月更文挑战第3天】在 Linux 系统中,可以通过多种方式执行内存中的脚本和程序:一是使用 `eval` 命令直接执行内存中的脚本内容;二是利用管道将脚本内容传递给 `bash` 解释器执行;三是将编译好的程序复制到 `/dev/shm` 并执行。这些方法虽便捷,但也需谨慎操作以避免安全风险。
|
22天前
|
网络协议 Linux
Linux查看端口监听情况,以及Linux查看某个端口对应的进程号和程序
Linux查看端口监听情况,以及Linux查看某个端口对应的进程号和程序
99 2
|
22天前
|
Linux Python
linux上根据运行程序的进程号,查看程序所在的绝对路径。linux查看进程启动的时间
linux上根据运行程序的进程号,查看程序所在的绝对路径。linux查看进程启动的时间
40 2
|
7天前
|
Python
惊!Python进程间通信IPC,让你的程序秒变社交达人,信息畅通无阻
【9月更文挑战第13天】在编程的世界中,进程间通信(IPC)如同一场精彩的社交舞会,每个进程通过优雅的IPC机制交换信息,协同工作。本文将带你探索Python中的IPC奥秘,了解它是如何让程序实现无缝信息交流的。IPC如同隐形桥梁,连接各进程,使其跨越边界自由沟通。Python提供了多种IPC机制,如管道、队列、共享内存及套接字,适用于不同场景。通过一个简单的队列示例,我们将展示如何使用`multiprocessing.Queue`实现进程间通信,使程序如同社交达人般高效互动。掌握IPC,让你的程序在编程舞台上大放异彩。
12 3
|
6天前
|
存储 监控 安全
探究Linux操作系统的进程管理机制及其优化策略
本文旨在深入探讨Linux操作系统中的进程管理机制,包括进程调度、内存管理以及I/O管理等核心内容。通过对这些关键组件的分析,我们将揭示它们如何共同工作以提供稳定、高效的计算环境,并讨论可能的优化策略。
13 0
|
18天前
|
Linux
使用qemu来学习Linux的休眠和唤醒
使用qemu来学习Linux的休眠和唤醒
|
18天前
|
Linux
linux内核原子操作学习
linux内核原子操作学习
|
19天前
|
Unix Linux
linux中在进程之间传递文件描述符的实现方式
linux中在进程之间传递文件描述符的实现方式
|
19天前
|
Ubuntu Linux
用crash工具学习Linux内核 —— 查看cgroup_roots
用crash工具学习Linux内核 —— 查看cgroup_roots
|
19天前
|
Ubuntu Linux 调度
Linux内核学习
Linux内核学习