linux地址空间

简介: 内存空间示意图进程是在内存中运行的,为了便于管理,不同的数据会存储在不同的区域,因此内存就被分为几部分,如下图所示:

内存空间示意图

进程是在内存中运行的,为了便于管理,不同的数据会存储在不同的区域,因此内存就被分为几部分,如下图所示:


6cae6b6caeb14b58a12a957c57436950.png

而这些区域都存什么东西呢?我们有下面一段程序:

#include<stdio.h>
  2 #include<stdlib.h>
  3 
  4 int un_g_val;
  5 int g_val = 2;
  6 
  7 
  8 int main(int argc, char* argv[], char* env[])
  9 {
 10   printf("adress: %p\n",main);
 11   printf("init: %p\n",&g_val);
 12   printf("uninit: %p\n",&un_g_val);
 13   char *p1 = (char*)malloc(10);
 14   char *p2 = (char*)malloc(10);
 15   char *p3 = (char*)malloc(10); 
 16 
 17   printf("heap_p1: %p\n",p1); // 堆地址
 18   printf("heap_p2: %p\n",p2);
 19   printf("heap_p3: %p\n",p3);
 20   printf("stack_p1: %p\n",&p1); //栈地址
 21   printf("stack_p2: %p\n",&p2);
 22   printf("stack_p3: %p\n",&p3);
 23 
 24   int i = 0;
 25   for(i=0;i<argc;i++)
 26   {
 27     printf("argv[%d]:%p\n",i,argv[i]);
 28   }
 29                                                                                                                                                                         
 30   for(i=0;env[i];i++)
 31   {               
 32     printf("env[%d]:%p\n",i,env[i]);
 33   }          
 34   return 0;   
   }

这个程序打印了各种变量的地址,印证了地址空间是确实存在的!

image.png

我们再看这个代码能编过吗?

 11   //常量                                                                                                                                                                
 12   "hello world";               
 13   50;                          
 14   'xxxx;       

可以编译过,并且该东西是字符常量它会硬编码进代码(因为代码也不可更改),所以字符常量会在代码区。

虚拟地址空间

看下面一段代码:该程序创建了一个子线程,共享父进程的全局变量,子进程会更改全局变量。

  1 #include<stdio.h>
  2 #include<stdlib.h>
  3 #include<unistd.h>
  4 int g_val = 2;
  5 
  6  
  7 int main()
  8 {
  9   pid_t id = fork();
 10 
 11   if(id == 0)
 12   {
 13     //child
 14     int cnt = 0;
 15     while(1)
 16     {
 17       printf("I am a child, pid_id:%d,  ppid_id:%d , g_val:%d, &g_val:%p\n",getpid(),getppid(), g_val,&g_val);
 18 
 19       sleep(1);
 20       cnt++;
 21       if(cnt==5)
 22       {
 23         g_val = 200;
 24         printf("child chamge g_val 2 -> 200 success\n");
 25       }
 26     }
 27   }
 28   else
 29   {                                                                                                                                                                     
 30     //father
 31     while(1)
 32     {
 33       sleep(1);
 34       printf("I am a father, pid_id:%d,  ppid_id:%d , g_val:%d, &g_val:%p\n",getpid(),getppid(), g_val,&g_val);
 35     }
 36   }
I am a child, pid_id:20414,  ppid_id:20413 , g_val:2, &g_val:0x60105c
I am a father, pid_id:20413,  ppid_id:18692 , g_val:2, &g_val:0x60105c
child chamge g_val 2 -> 200 success
I am a child, pid_id:20414,  ppid_id:20413 , g_val:200, &g_val:0x60105c
I am a father, pid_id:20413,  ppid_id:18692 , g_val:2, &g_val:0x60105c

我们从运行的结果可以看出来,子进程修改全局变量后,子进程的值改变,父进程的值没变,但是全局变量的地址空间一样!!!

为什么会产生这种情况呢??

我们大胆猜测,程序打印的地址,一定不是物理地址,因为同一地址不可能存储两个不一样的值 。因为打印出来的是虚拟地址!!!

虚拟地址

每一个程序都有自己的虚拟地址空间,就像PCB一样,每一个程序都有一个属于自己的虚拟地址空间,记录着各种数据的位置,供操作系统使用。

如下图所示:代码在准备执行时,会编译成可执行程序,此时程序里面,即代码与代码是有地址的(这个地址就是虚拟地址),程序被加载到内存后:


  1. 首先系统会创建PCB
  2. PCB会有一个指针,指向程序虚拟内存
  3. 根据虚拟内存的地址所对应的物理内存地址,填充页表,完成映射。

1b35d3ae4d7f446bb11fb0d8a3b7f03c.png

页表 :页表的作用就是完成虚拟地址到物理地址的转换

下图是解释上面代码例子的虚拟空间问题:子进程创建后,获得父进程一模一样的地址空间,当触发写时拷贝时,才复制资源。这样会节省空间。

2e15b82b83054417859ead9008d47399.png

进程地址空间生命周期图解

  1. 程序被读进内存的过程


0eb7f1814919464ea0d98e4e7ed3b9db.png

程序执行的流程

2846631919754502b55d55ef2c2f74a0.png


为什么要有地址空间呢?

1.为了保护物理内存,页表将各个进程隔离起来了。因为地址空间和页表是OS创建并且维护的,意味着想要使用地址空间和页表映射,必须在OS的监管之下进行访问。因此保证了进程之间的独立性,互不影响。


2.因为有地址空间和页表的存在,OS可以实现,对未来的数据进行任意位置的加载,只需根据页表即可找找到杂乱无章的数据。这样物理内存的分配和进程的管理就可以分开进行管理。内存管理模块和进程管理模块就完成了解耦合。


3.如果我申请了物理空间,但是我不立马使用,我会造成空间的浪费!但是如果我在虚拟空间上申请,当我没使用时,也没有为我开物理空间 。当我使用时,OS才帮我开辟空间,这样可以保证内存的使用率是100%。


4.物理内存上的数据理论上可以在任意位置加载,这会导致物理内存上的所有数据都是乱序的。但是有VA+页表的存在,我们可以方便的直接找到各种数据,在进程的视角,数据是那么的竟然有序!因此,可以将内存分布有序化!


小结

OS的系统是深而庞杂的,此文章只是浅显的谈论了以下内存空间的概念及其分布。更详细的内容,还请读者自行查阅。

目录
相关文章
|
5月前
|
存储 Linux 调度
深入理解Linux内核:从用户空间到内核空间的旅程
【8月更文挑战第4天】在这篇文章中,我们将探索Linux操作系统的核心—内核。通过了解内核如何管理硬件资源,以及它是如何在用户空间和内核空间之间架起桥梁的,我们可以更好地理解操作系统的工作原理。本文将介绍一些关键概念,并通过代码示例来揭示这些概念是如何在实际中应用的。无论你是开发者、系统管理员还是对操作系统感兴趣的爱好者,这篇文章都将为你提供一个深入了解Linux内核的机会。让我们开始这段旅程吧!
|
3月前
|
网络协议 Linux 开发工具
linux系统配置固定地址
linux系统配置固定地址
|
5月前
|
存储 NoSQL Linux
深度探索Linux操作系统 —— 从内核空间到用户空间3
深度探索Linux操作系统 —— 从内核空间到用户空间
54 9
|
5月前
|
存储 NoSQL Linux
深度探索Linux操作系统 —— 从内核空间到用户空间2
深度探索Linux操作系统 —— 从内核空间到用户空间
55 7
|
5月前
|
存储 安全 Linux
深度探索Linux操作系统 —— 从内核空间到用户空间1
深度探索Linux操作系统 —— 从内核空间到用户空间
60 4
|
5月前
|
监控 Linux
在Linux中,如何检查磁盘使用情况和剩余空间?
在Linux中,如何检查磁盘使用情况和剩余空间?
|
5月前
|
网络协议 Ubuntu Linux
会Linux系统上配IPv6地址的网工,那真是老6了!
会Linux系统上配IPv6地址的网工,那真是老6了!
|
5月前
|
Linux
【Deepin 20系统】Linux系统修改MATLAB 打开默认地址(默认工作空间)
如何在Linux系统中修改MATLAB的默认打开地址(默认工作空间),通过编辑matlabrc.m文件来设置启动MATLAB时的初始目录。
151 0
|
6月前
|
存储 Linux
linux /www/server/cron内log文件占用空间过大,/www/server/cron是什么内容,/www/server/cron是否可以删除
linux /www/server/cron内log文件占用空间过大,/www/server/cron是什么内容,/www/server/cron是否可以删除
100 1