在ANSI C(标准C)的任何一种实现中,存在两个不同的环境。
- 第1种是翻译环境,在这个环境中源代码被转换为可执行的机器指令。
- 第2种是执行环境,它用于实际执行代码。
今天我们就讲解他们在这环境过程都做了什么。
详解编译+链接
翻译环境
程序的编译大概过程
在VS编译上一个项目中可能存在多个.c.h的源文件,他们都会单独经过编译器(cl.exe)生成自己的目标文件(.obj).在经过链接器(link.exe)和链接库生成 可执行程序(.exe)
- 组成一个程序的每个源文件通过编译过程分别转换成目标代码(object code)。
- 每个目标文件由链接器(linker)捆绑在一起,形成一个单一而完整的可执行程序。
- 链接器同时也会引入标准C函数库中任何被该程序所用到的函数,
而且它可以搜索程序员个人的程序库,将其需要的函数也链接到程序中。
编译本身也分为几个阶段
接下来我们就讲解编译环境如何一步一步形成我们的可执行程序的
VS是一个集成开发环境,集成很多的功能
ctrl+F5
不方便观察每个细节的功能
接下来,我使用这个vscode gcc编译器给大家演示
编译本身也分为几个阶段
(test.c) 源文件 -> 翻译环境 -> test.exe -> 可执行程序
而翻译环境分为几个两个阶段
- 编译(编译器)
而编译又划分3个阶段
- 预编译
- 编译
- 汇编
- 链接 (链接器)
合并段表
符号表的合并和重定位
那我们接下来看看预编译会发生什么事情;
- 输入gcc test.c -E (打开预编译) -o test,i (-o输出到test.i)上
此时tesri.i存放的是指向这些数据(这些数据好像我们都不认识)其实这是我们# include头文件的展开
> 我们划到最后看此时放的是我们自己写的代码
此时我们发现预处理阶段会把我们的头文件展开
2.我们在次修改下代码
- 我们再次打开预处理gcc test.c -E (打开预编译) -o test,i (-o输出到test.i)。 我们划到最后再看下代码
我们发现#define和注释都不见了,define给代替了
所以我们预处理处理的事情是
1.头文件的包含
#include
2.注释的删除
3.#define 定义的符号的替换
在预处理阶段很多事情都与预处理的指令相关。
比如:
#define
#include
#pragmapack
那我们再看看编译阶段会发生什么:
2.输入gcc -S test.c 这时候我们会生成一个test.S的文件,该文件就是编译文件
我们打开test.S放的是什么
test.S 放的是汇编指令
- 编译时我们会把C语言代码转换成汇编指令
其实更细的说在这编译期间转换成汇编指令期间,还会处理
1 语法分析
2 词法分析
3 语义分析
4 符号汇总
那汇编译阶段又会发生什么:
输入gcc -c test.c 此时会生成一个(test.o)文件,目标文件
vs是生成为.obj文件
gcc是生成.o文件
- 此时我们想看test.o文件,会发现该文件无法打开
因为此时已经把汇编代码转换成二进制的指令了,并且还会形成符号表
- 链接时会 合并段表,符号表的合并和重定位
- 汇编译阶段时会形成符号表
那他们有什么关系呢 图解:
符号汇总-> 形成符号表 -> 符号表的合并和重定位 -> 可执行程序
重定符号表又有什么用呢?其实很好理解
比如把add.c文件的add函数删掉,重定符号表时还会取到下面那个Add 0x000 无效地址,真正在链接时找这个函数时就会报错。
你只是在声明这个函数,但是这个函数地址并没有真实存在
其实 合并段表,形成符号表,符号表的合并和重定位,他重新为链接期间这个跨源文件的代码进行协作时候在做铺垫
总结
1.预处理 选项 gcc -E test.c -o test.i
预处理完成之后就停下来,预处理之后产生的结果都放在test.i文件中。
2.编译 选项 gcc -S test.c
编译完成之后就停下来,结果保存在test.s中。
3.汇编 gcc -c test.c
汇编完成之后就停下来,结果保存在test.o中。
运行环境
程序执行的过程:
1.程序必须载入内存中。在有操作系统的环境中:一般这个由操作系统完成。在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成。
2.程序的执行便开始。接着便调用main函数。
3.开始执行程序代码。这个时候程序将使用一个运行时堆栈(stack),存储函数的局部变量和返回地址。程序同时也可以使用静态(static)内存,存储于静态内存中的变量在程序的整个执行过程一直保留他们的值。
4.终止程序。正常终止main函数;也有可能是意外终止。