C语言数据的存储

简介: 目录1. 数据类型详细介绍: 1.1 类型的基本归类2. 整形在内存中的存储 2.1 原码,反码,补码 2.2 大小端介绍3. 浮点型在内存中的存储 3.1 例题 3.2 浮点数存储规则

1. 数据类型详细介绍:

前面我们已经学习了基本的内置类型:


image.png


以及他们所占存储空间的大小:


char:1字节  short:2字节 int、long、float均4字节 double、long long均8字节


当然还有一种数据类型,平时用到相对较少:但是可以装X  ------>_Bool类型


_Bool类型是专门用来判断真假的,平时的C语言中我们用0表示假,非0表示真,如例:

#include<stdio.h>
int main()
{
  int flag = 0;
  if (flag)
  {
  }
  return 0;
}

C99 中引入了布尔类型

#include<stdio.h>
#include<stdbool.h>
int main()
{
  _Bool flag = true;
  if (flag)
  {
    printf("hehe\n");
  }
  return 0;
}

类型的意义:

1. 使用这个类型开辟内存空间的大小(大小决定了使用范围)。

2. 如何看待内存空间的视角。

    1.1 类型的基本归类

整形家族:image.png

#include<stdio.h>
int main()
{
  //int num = 10;
  //printf("%d\n", num);  // 10
  //num = -10;
  //printf("%d\n", num);  // -10
  unsigned int num = 10;
  printf("%d\n", num);  // 10
  num = -10;
  printf("%d\n", num);  // -10
  printf("%u\n", num);  // 
  return 0;
}

浮点数家族:

image.png

构造类型:(也叫自定义类型)

image.png

指针类型:

image.png

空类型:

void 表示空类型(无类型)

通常应用于函数的返回类型、函数的参数、指针类型。

#include<stdio.h>
void test(void)
{
  void* p;
}
int main()
{
  return 0;
}

2. 整形在内存中的存储

我们之前讲过一个变量的创建是要在内存中开辟空间的。空间的大小是根据不同的类型而决定的。 那接下来我们谈谈数据在所开辟内存中到底是如何存储的? 比如:

#include<stdio.h>
int main()
{
  int a = 10;
  int b = -10;
  return 0;
}

当我们调试时:image.png我们知道为 a 分配四个字节的空间。 那如何存储? 下来了解下面的概念:


    2.1 原码,反码,补码

整数的二进制表示有3种表示形式:原码----反码----补码

而内存存储的是二进制的补码!

整数:正数 / 负数

正数:原码反码补码相同

负数:原码:按照一个数的正,负直接写出来的二进制就是原码

           反码:符号位不变,其他位按位取反

           补码:反码的二进制序列+1,就是补码

符号位为0,正数,为1,负数

15:

00000000000000000000000000001111   ----->原码-反码-补码    最高位为符号位0,正数

-15:

//10000000000000000000000000001111   ----->原码

//11111111111111111111111111110000   ----->反码

//11111111111111111111111111110001   ----->补码


10

00000000000000000000000000001010  原码反码补码相同

4个二进制转化为一个16进制

0   0   0   0   0   0   0   1

-10

10000000000000000000000000001010  原码

11111111111111111111111111110101  反码

11111111111111111111111111110110  补码

4个二进制转化为一个16进制

f   f   f   f   f   f   f    6


为什么内存存储的是二进制的补码呢

计算机只有加法器

如 1+(-1)=0

若采用原码相加:

00000000000000000000000000000001   1的原码

10000000000000000000000000000001   -1的原码

---------------------------------  相加

10000000000000000000000000000010 ----> -2 err

若采用补码相加:

00000000000000000000000000000001   1的补码

11111111111111111111111111111111   -1的补码

---------------------------------  相加

100000000000000000000000000000000 ----> 0 right

原码到补码,补码到补码:

 1

法一:

10000000000000000000000000000001  原码

               取反

11111111111111111111111111111110  反码

               加1

11111111111111111111111111111111  补码

               减1

11111111111111111111111111111110  反码

               取反

10000000000000000000000000000001  原码

法二:

10000000000000000000000000000001  原码

               取反

11111111111111111111111111111110  反码

               加1

11111111111111111111111111111111  补码

               取反

10000000000000000000000000000000  

               加1

10000000000000000000000000000001  原码

综上所述:

原码取反+1得到补码,补码再取反+1得到原码

2.2 大小端介绍

什么大端小端:


大端(存储)模式,是指数据的低位保存在内存的高地址中,而数据的高位,保存在内存的低地址 中;


小端(存储)模式,是指数据的低位保存在内存的低地址中,而数据的高位,,保存在内存的高地 址中。


为什么有大端和小端:


为什么会有大小端模式之分呢?这是因为在计算机系统中,我们是以字节为单位的,每个地址单元 都对应着一个字节,一个字节为8bit。但是在C语言中除了8 bit的char之外,还有16 bit的short型,32 bit的long型(要看具体的编 译器),另外,对于位数大于8位 的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如 何将多个字节安排的问题。因此就 导致了大端存储模式和小端存储模式。 例如:一个 16bit 的 short 型 x ,在内存中的地址为 0x0010 , x 的值为 0x1122 ,那么 0x11 为 高字节, 0x22 为低字节。对于大端 模式,就将 0x11 放在低地址中,即 0x0010 中, 0x22 放在高地址中,即 0x0011 中。小端模式, 刚好相反。我们常用的 X86 结构是 小端模式,而 KEIL C51 则为大端模式。很多的ARM,DSP都为小端模式。有些ARM处理器还可以 由硬件来选择是大端模式还是小端模式。


百度2015年系统工程师笔试题:


请简述大端字节序和小端字节序的概念,设计一个小程序来判断当前机器的字节序。(10分)


法一:

#include<stdio.h>
int main()
{
  int a = 1;
  char* p = (char*)&a;
  if (*p == 1)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}
 // 小端

法二:

#include<stdio.h>
int check_sys()
{
  int a = 1;
  char* p = (char*)&a;
  //if (1 == *p)
  //{
  //  return 1;  //小端
  //}
  //else
  //{
  //  return 0;  //大端
  //}
  return*p;  //优化
  return *(char*)&a;//再次优化
}
int main()
{
  int ret = check_sys();  //返回1是小端,返回0是大端
  if (ret == 1)
  {
    printf("小端\n");
  }
  else
  {
    printf("大端\n");
  }
  return 0;
}
// 小端

3. 浮点型在内存中的存储

    3.1 例题

#include<stdio.h>
int main()
{
  int n = 9;
  float* pFloat = (float*)&n;
  printf("n的值为:%d\n", n);
  printf("*pFloat的值为:%f\n", *pFloat);
  *pFloat = 9.0;
  printf("num的值为:%d\n", n);
  printf("*pFloat的值为:%f\n", *pFloat);
  return 0;
}

image.png  3.2 浮点数存储规则

num 和 *pFloat 在内存中明明是同一个数,为什么浮点数和整数的解读结果会差别这么大? 要理解这个结果,一定要搞懂浮点数在计算机内部的表示方法。


详细解读:


根据国际标准IEEE(电气和电子工程协会) 754,任意一个二进制浮点数V可以表示成下面的形式:


(-1)^S * M * 2^E


(-1)^s表示符号位,当s=0,V为正数;当s=1,V为负数。


M表示有效数字,大于等于1,小于2。


2^E表示指数位。


举例来说:


十进制的5.0,写成二进制是 101.0 ,相当于 1.01×2^2 。 那么,按照上面V的格式,可以得出s=0,M=1.01,E=2。


十进制的-5.0,写成二进制是 -101.0 ,相当于 -1.01×2^2 。那么,s=1,M=1.01,E=2。


IEEE 754规定:


对于32位的浮点数,最高的1位是符号位s,接着的8位是指数E,剩下的23位为有效数字M。

image.png



对于64位的浮点数,最高的1位是符号位S,接着的11位是指数E,剩下的52位为有效数字M。


image.png


IEEE 754对有效数字M和指数E,还有一些特别规定。


前面说过, 1≤M<2 ,也就是说,M可以写成 1.xxxxxx 的形式,其中xxxxxx表示小数部分。 IEEE 754规定,在计算机内部保存M时,默认这个数的第一位总是1,因此可以被舍去,只保存后面的 xxxxxx部分。比如保存1.01的时 候,只保存01,等到读取的时候,再把第一位的1加上去。这样做的目的,是节省1位有效数字。以32位 浮点数为例,留给M只有23位, 将第一位的1舍去以后,等于可以保存24位有效数字。


至于指数E,情况就比较复杂。


首先,E为一个无符号整数(unsigned int) 这意味着,如果E为8位,它的取值范围为0~255;如果E为11位,它的取值范围为0~2047。但是,我们 知道,科学计数法中的E是可以出 现负数的,所以IEEE 754规定,存入内存时E的真实值必须再加上一个中间数,对于8位的E,这个中间数 是127;对于11位的E,这个中间 数是1023。比如,2^10的E是10,所以保存成32位浮点数时,必须保存成10+127=137,即 10001001。


然后,指数E从内存中取出还可以再分成三种情况:


E不全为0或不全为1


这时,浮点数就采用下面的规则表示,即指数E的计算值减去127(或1023),得到真实值,再将 有效数字M前加上第一位的1。 比如: 0.5(1/2)的二进制形式为0.1,由于规定正数部分必须为1,即将小数点右移1位,则为 1.0*2^(-1),其阶码为-1+127=126,表示为 01111110,而尾数1.0去掉整数部分为0,补齐0到23位00000000000000000000000,则其二进 制表示形式为:


image.png


E全为0


这时,浮点数的指数E等于1-127(或者1-1023)即为真实值, 有效数字M不再加上第一位的1,而是还原为0.xxxxxx的小数。这样做是为了表示±0,以及接近于 0的很小的数字。


E全为1


这时,如果有效数字M全为0,表示±无穷大(正负取决于符号位s);


//解析前面那道题目的原因:


printf("*pFloat的值为:%f\n", *pFloat);  //0.000000



00000000000000000000000000001001  ---> 9的原码反码补码

pfloat存放的是n的地址

在通过以%f的形式打印时,其认为最左边的0就是符号位,即S,后8个0就是E,最后的23位是M

E为全0,E的真实值是1-127=-126

2^-126

有效位: 0.00000000000000000001001

(-1)^0*0.00000000000000000001001*2^-126

算出来的结果只能保存6位有效数字,由于数值特别小,所以结果为0.000000


printf("num的值为:%d\n", n);            //1091567616


9.0 --->十进制

1001.0 --->2进制

1.001*2^3 --->科学计数法

S=0

M=1.001

E=3

E在存进去要加上127即为130,转换成二进制即为10000010

0100 0001 0001 0000 0000 0000 0000 0000

将上述二进制位用十六进制表示为:

4    1    1    0    0    0    0    0

小端排列

01000001000100000000000000000000

因为是以%d的形式打印出来,上述二进制数是正数,换成10进制表示为1091567616


//  浮点型存储纯属练内功


相关文章
|
1月前
|
存储 程序员 编译器
C 语言中的数据类型转换:连接不同数据世界的桥梁
C语言中的数据类型转换是程序设计中不可或缺的一部分,它如同连接不同数据世界的桥梁,使得不同类型的变量之间能够互相传递和转换,确保了程序的灵活性与兼容性。通过强制类型转换或自动类型转换,C语言允许开发者在保证数据完整性的前提下,实现复杂的数据处理逻辑。
|
1月前
|
存储 数据管理 C语言
C 语言中的文件操作:数据持久化的关键桥梁
C语言中的文件操作是实现数据持久化的重要手段,通过 fopen、fclose、fread、fwrite 等函数,可以实现对文件的创建、读写和关闭,构建程序与外部数据存储之间的桥梁。
|
2月前
|
存储 数据建模 程序员
C 语言结构体 —— 数据封装的利器
C语言结构体是一种用户自定义的数据类型,用于将不同类型的数据组合在一起,形成一个整体。它支持数据封装,便于管理和传递复杂数据,是程序设计中的重要工具。
|
2月前
|
存储 编译器 数据处理
C 语言结构体与位域:高效数据组织与内存优化
C语言中的结构体与位域是实现高效数据组织和内存优化的重要工具。结构体允许将不同类型的数据组合成一个整体,而位域则进一步允许对结构体成员的位进行精细控制,以节省内存空间。两者结合使用,可在嵌入式系统等资源受限环境中发挥巨大作用。
77 11
|
4月前
|
存储 编译器 C语言
C语言存储类详解
在 C 语言中,存储类定义了变量的生命周期、作用域和可见性。主要包括:`auto`(默认存储类,块级作用域),`register`(建议存储在寄存器中,作用域同 `auto`,不可取地址),`static`(生命周期贯穿整个程序,局部静态变量在函数间保持值,全局静态变量限于本文件),`extern`(声明变量在其他文件中定义,允许跨文件访问)。此外,`typedef` 用于定义新数据类型名称,提升代码可读性。 示例代码展示了不同存储类变量的使用方式,通过两次调用 `function()` 函数,观察静态变量 `b` 的变化。合理选择存储类可以优化程序性能和内存使用。
172 82
|
3月前
|
存储 C语言 C++
深入C语言,发现多样的数据之枚举和联合体
深入C语言,发现多样的数据之枚举和联合体
深入C语言,发现多样的数据之枚举和联合体
|
3月前
|
存储 C语言
C语言中的浮点数存储:深入探讨
C语言中的浮点数存储:深入探讨
|
3月前
|
存储 C语言
深入C语言内存:数据在内存中的存储
深入C语言内存:数据在内存中的存储
|
3月前
|
C语言
回溯入门题,数据所有排列方式(c语言)
回溯入门题,数据所有排列方式(c语言)
|
4月前
|
存储 人工智能 C语言
数据结构基础详解(C语言): 栈的括号匹配(实战)与栈的表达式求值&&特殊矩阵的压缩存储
本文首先介绍了栈的应用之一——括号匹配,利用栈的特性实现左右括号的匹配检测。接着详细描述了南京理工大学的一道编程题,要求判断输入字符串中的括号是否正确匹配,并给出了完整的代码示例。此外,还探讨了栈在表达式求值中的应用,包括中缀、后缀和前缀表达式的转换与计算方法。最后,文章介绍了矩阵的压缩存储技术,涵盖对称矩阵、三角矩阵及稀疏矩阵的不同压缩存储策略,提高存储效率。
506 8