本节书摘来自异步社区《嵌入式Linux与物联网软件开发——C语言内核深度解析》一书中的第1章,第1.4节,作者朱有鹏 , 张先凤,更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.4 内存编址和寻址、内存对齐
1.4.1 内存编址方法
上面我们讲了内存的单位,以及内存的逻辑模型,这节我们会更加详细地介绍这个逻辑模型。内存在逻辑上就是一个一个的格子,这些格子可以用来装东西(里面装的东西就是数据),每个格子有一个编号,这个编号就是内存地址,这个内存地址(一个数字)和这个格子的空间(实质是一个内存空间)是一一对应且永久绑定的。这就是内存的编址方法。
在程序运行时,计算机中CPU实际只认识内存地址,而不关心这个地址所代表的空间怎么分布(硬件设计保证了只要按照这个地址就一定能找到这个格子,这就涉及了内存单元的两个重要概念—地址和空间。那么问题也就来了,我们究竟以多大空间来划分一个格子,并绑定一个地址呢?)。
1.4.2 关键:内存编址是以字节为单位
前面一直提到内存地址,那么我们究竟以多大的内存空间来划分绑定一个地址?答案是:我们以一个字节为基本单元对整个内存进行划分,并且一一绑定地址。常说的一个个内存空间指的就是内存单元。由此可见一个内存单元就是一个字节。如果把内存比喻为一栋大楼,那么这个楼里面的一个一个房间就是一个一个内存单元,每个房间的编号就好比内存单元地址。32根地址线可以找到多大的内存空间?每根线有两种状态,要么是0,要么是1,所以32根有2的32次幂种状态,每种状态对应一个地址,就有2的32次幂个地址。而内存以字节编址,一个地址对应一个字节,那就有2的32次幂个字节(B),我们把它换算成G,也就是4GB内存,大于4GB内存,对于CPU来说将无法寻址。这就好比你只有一个木桶,哪怕你身边有再多大江大河,但你还是只能装一桶水……
232÷(1024×1024×1024)=232÷230=22=4(G)
注意:1024=210
计算内存大小时,2的10次幂是1024,不是数学上的1000。所以1GB=1024MB,1MB=1024KB,1KB=1024B,因此232=4GB
在讲内存位宽的时候我们就提到了内存编址,无论是多少位的内存,都是以字节为单位进行内存编址的。下面是64位位宽内存的编址,表示在一定时间(时间指的是一个时钟周期,不需要了解)内所能传送数据的位数是64位,也就是8个内存单元,所以我们把8个单元画成一排。
64 位内存模型
1.4.3 内存和数据类型的关系
现在搞清楚了内存单元的划分,我们有必要讨论一下C语言中的基本数据类型:char、short、int、long、float、double。在C语言中,数据类型的本质表示一个内存格子的长度和解析方法。也就是在定义变量时,到底需要给这个变量分配多大空间,按照什么样的方式去解析该空间。用int和char类型定义一个变量时,其分配的空间大小自然是不同的。
当然,在32位系统中定义变量最好用int,这样效率高,因为32位系统中很多硬件本身都是32位的,配合定义的int型变量在内存中恰好分配4个字节,使得软件和硬件对于数据的处理非常契合,这样的工作效率自然就高。32位的硬件配置天生就适合定义32位的int型变量。千万不要单纯地认为定义char型变量由于分配了更少的内存空间,所以效率就更高,因此我们一直强调写程序时要尽量配合硬件特点。
在很多32位系统环境下,当定义bool类型变量时,我们基本都是用int来替代。虽然bool型只需要一个位,但是我们定义一个整型替代时,看似浪费了31个bit,但是好处是效率会高很多。对于现代计算机来说,内存还是很充足的,浪费31个bit并不是一个很大的问题。特别提示一点,int(整型)这个“整”字体现在它和CPU本身的数据位宽是一样的,如32位的CPU,整型就是32位,int就是32位。
问题:实际编程时,节省内存和提高效率到底谁重要?
回答:很多年前内存很贵,因此内存都很少,那时候写代码以省内存为主。现在随着半导体技术的发展,内存变得很便宜了,现在的机器都是高配,不在乎省一点内存,而效率和用户体验变成了关键。所以现在写程序大部分都是以效率为重。
1.4.4 内存对齐
什么是内存对齐,首先这是一个硬件问题。因为是逻辑模型,前面我们为了便于大家理解,在画内存逻辑图的时候并没有体现内存单元的对齐。但此时我们为了分析内存对齐,就需要画出内存的这个特性。内存对齐其实也很好理解。
32位内存模型,单元格中的数是单元格编号。
假设我们现在要在C语言中用int a;定义一个int类型变量,在内存中就必须分配4个字节来存储这个a的数据。下面有两种不同的内存分配思路和策略。
第一种:0 1 2 3 对齐访问
第二种:1 2 3 4 或者2 3 4 5或者3 4 5 6 非对齐访问
内存的对齐访问不是逻辑的问题,而是硬件的问题。从硬件角度来说,对于32位的内存,0 1 2 3这四个单元本身逻辑上就有相关性,四个组合起来当作一个int,在硬件上就是合适的,效率就高。对齐访问更符合硬件规律,所以效率更高;非对齐访问因为和硬件本身不搭配,所以效率不高。因为兼容性的问题,通常硬件也都提供非对齐访问,但是效率要低很多。一般来说,除了直接使用汇编外,使用高级语言编写程序的时候,内存空间分配都会自动对齐。