了解数据在计算机中的存储方式,有助于我们更好的理解计算机与编程,从内部理解掌握计算机的原理,今天就聊一聊数据在计算机中的存储。
一、数据的基本类型
C语言中,数据主要有以下五种。
1. 整型(有符号与无符号)
(1)有符号:(signed)char, (signed)short, (signed)int, (signed)long, (signed)long long.
(2) 无符号:unsigned char, unsigned short, unsigned int , unsigned long, unsigned long long.
2. 浮点型
(1)有符号: (signed) float, (signed) double.
(2) 无符号: unsigned float, unsigned double.
3. 构造类型(结构体, 枚举, 联合,注意数组在一定程度上也属于构造类型)
4. 指针类型
5. 空类型(如函数调用中的void, 指针中的NULL)
下面就最常用的整型及浮点型在内存中的存储作以详细的介绍。
计算机中表示整型的方式有三种:原码,反码,补码。其中,原码是直接将整型数据转换成二进制之后的表示方式,而反码是指原码的符号位(通常二进制表示的最高位为符号位,0表示正,1表示负)不变,其余按位取反而得到,补码是在反码的基础上加1。
注意:数据在计算机中均是以补码形式存储的,而我们直接翻译数据得到的是原码, 所以我们经常需要在原码与补码之间相互转换。其中,对于有符号整型及无符号无符号整型具体存储如下:无符号整型三码相同,有符号整型中正数三码相同,只有负数需要相互转换!bu
至于为什么要有反码与补码,这与硬件电路有关,这里不做叙述。
下面介绍计算机中数据存储的另一个重要原则:大端字节序与小端字节序存储。
数据一般是以字节为最小单位的,如char类型为1个字节,int类型为4个字节,这就涉及到放到内存中的顺序问题,我们知道,内存其实就是一系列 的地址,那么在存放数据时数据的地位是存放在低地址还是高地址处呢?其实都有可能。这就是大小端字节序分类的由来。
大端字节序:是指数据的低位存储在地址的高位中,而数据的高位存储在地址的低位。
小端字节序:是指数据的低位存储在地址的低位中,而数据的高位存储在地址的高位。
最后介绍一下浮点型在内存中的存储,根据国际标准IEEE(电气和电子工程协会) 754 规定,浮点型数据的存储可表示成如下形式:
(-1)^S * M * 2^E。
(-1)^s表示符号位,当s=0,正数;当s=1,负数。
M表示有效数字,大于等于1,小于2。
2^E表示指数位。
在32为平台中,S占一个字节,M占23个字节,E占8个字节;而在64位平台中,S占一个字节,M占52个字节,E占11个字节。其具体分布为S--E--M,及先是S,然后是E,最后是M。
由于M均为1.XXXXX,所以在存储时会将1舍去,仅存储小数点后的数字,这样就可以多存一位,精度更高,只是注意在读取时不要忘了将那个1加上。
而E就会比较复杂,首先,它是一个无符号整型,但我们都知道,指数是可以为负的,所以E具体存储时会加上一个正数(32位平台加127,64位平台加1023),这样就能解决问题了,同样的,在读取时要记得减去相应的数字。
在具体读取浮点数时右分为三种情况:
1. E全为0(补码),这是浮点数趋近无穷小,我们就认为是0.
2. E全为1(补码),这是浮点数趋近无穷大.
3. E不全为0,也不全为1,这时正常读取就可以了。
好了,以上就是关于数据存储的相关内了,水平有限,还请大家相互交流,相互学习。