6. 内联函数
6.1 概念
以**inline
修饰的函数叫做内联函数,编译时C++编译器会在调用内联函数的地方展开**,没有函数调用建立栈帧的开销,内联函数提升程序运行的效率。
用示例具体解释一下:
先来看看普通的调用函数:
这样调用函数就是我们对函数栈帧了解的常识,通过符号表的地址找到函数的地址并直接进行引用。
由于上面的概念提到,内联函数不建立栈帧,因此,在普通的debug环境下是没办法使用的,因为debug会进行调试,调试就会利用栈帧,因此需要进行一系列的设置或者直接将debug换成release环境。
在debug环境下进行一系列设置:
环境配置完之后看看内联之后汇编的变化:
/
我们发现,这里直接就是mov
和add
,并没有Add
函数地址的声明,因此,内联函数就是将内部之间展开使用,而不是创建栈帧后生成符号表。
6.2特性
1.inline是一种以空间换时间的做法,如果编译器将函数当成内联函数处理,在编译阶段,会用函数体替换函数调用,缺陷:可能会使目标文件变大,优势:少了调用开销,提高程序运行效率。
2.inline对于编译器而言只是一个建议,不同编译器关于inline实现机制可能不同,一般建议:将函数规模较小(即函数不是很长,具体没有准确的说法,取决于编译器内部实现)、不是递归、且频繁调用的函数采用inline修饰,否则编译器会忽略inline特性。下图为《C++prime》第五版关于inline的建议:
第二条特性中,为什么建议函数规模较小且不频繁调用的函数才用内联呢?
关于这个,整个第二条特性说的其实都是这个问题,比如像递归那样的函数,由于没有栈帧,其所有的执行情况都会在编译的时候展开使用,这样函数的规模就变得非常大,那么这个问题同样可以变成:为什么函数长了以后不展开呢?
最准确的回答是因为代码膨胀 ,由于内联函数是直接展开,如果调用次数过多或者函数展开过长,会给程序造成很大的开销,这反而远离了我们使用内联函数的初衷。
对于调用次数过多来举例:假设内联函数有30条指令,如果有10000个调用的地方,我们采用内联函数之后,就会将其一一展开,原本的1行函数就会变成30行,那么总的行数就会变成:30*10000 = 30w行,但如果不使用内联函数,这样就是30+10000 = 10030行,并且编译好的指令影响的是可执行程序的大小,也就是安装包(包括.exe和.dll等静态/动态库);
对于安装包来说,一定是越小越好(更新软件时间越快越好,内存越小越好)。可见,这种情况下,内联的效率远远低于直接调用原本的函数的栈帧的效率。
此外,我们也发现,上述红色框处的Note,这个具体的意思是对于内联来说,如果出现了我们上述叙述的情况,即代码膨胀的情况,编译器将会拒绝这个请求,也就是不按照内联函数展开,而是像原本一样利用函数栈帧,生成符号表,
#define _CRT_SECURE_NO_WARNINGS 1 #include<iostream> inline int func(int x, int y) { int ret = x + y; ret = x + y; ret = x + y; ret = x / y; ret += x + y; ret = x + y; ret -= x + y; ret = x + y; ret = x * y; ret = x + y; ret = x + y; return ret; } int main() { int ret = func(10, 20); return 0; }
当我们设置完debug环境后,假设我们在函数中多调用语句:会发现仍然调用了栈帧,产生符号表中函数的地址。
接下来看看如果函数很短的话:
#define _CRT_SECURE_NO_WARNINGS 1 #include<iostream> inline int func(int x, int y) { int ret = x + y; return ret; } int main() { int ret = func(10, 20); return 0; }
出现的结果就和我们想的一样,直接展开不产生符号表中函数的地址!因此,内联函数是否能够请求成功还是看编译器。
- inline不建议声明和定义分离,分离会导致链接错误。因为inline被展开,就没有函数地址了,链接就会找不到。
对于这个问题,上述已经提到过内联之后,函数由于不建立栈帧因此不会产生地址,在链接的时候声明与此函数定义的符号表中的地址也不会合并,通过之前的文章:程序的编译和链接,我们知道在最后链接的过程中,函数定义的地址和函数声明的地址在符号表中最后会合并成定义的地址(因为声明函数的地址不是函数的真正地址),由于内联不产生地址,这最后符号表合并之后的地址也就不是其函数定义的地址,因此这样会引发错误。
当然,如果我们定义内联函数与main()函数在同一个文件中(同一个.cpp)就不会出现链接的情况,所以即便我们定义内联函数,在一个文件中无论形不形成符号表,都不会报错,也就是说无论函数是否建立栈帧生成地址都不会影响,即这样:
6.3内联函数的适用范围
- 可以替换宏:
- 宏的缺点:
- 不能进行调试
- 没有安全类型检查
- 容易写错
- 频繁调用小函数
- 类似于经常用到的
Swap
函数,inline优化后没有栈帧消耗
7. auto关键字(C++11)
7.1 类型别名思考
随着程序越来越复杂,程序中用到的类型也越来越复杂,经常体现在:
- 类型难于拼写
- 含义不明确导致容易出错
#include <string> #include <map> int main() { std::map<std::string, std::string> m{ { "apple", "苹果" }, { "orange", "橙子" }, {"pear","梨"} }; std::map<std::string, std::string>::iterator it = m.begin(); while (it != m.end()) { //.... } return 0; }
std::map::iterator
是一个类型,但是该类型太长了,特别容易写错。聪明的同学可能已经想到:可以通过typedef给类型取别名,比如:
#include <string> #include <map> typedef std::map<std::string, std::string> Map; int main() { Map m{ { "apple", "苹果" },{ "orange", "橙子" }, {"pear","梨"} }; Map::iterator it = m.begin(); while (it != m.end()) { //.... } return 0; }
- 使用typedef给类型取别名确实可以简化代码,但是typedef有会遇到新的难题:
typedef char* pstring; int main() { const pstring p1; // 编译成功还是失败? const pstring* p2; // 编译成功还是失败? return 0; }
在这个代码中,第二个是错误的,因为typedef不像define一样在预编译阶段进行文本替换,也就是说并不会在预编译阶段用char*去替换pstring,既然替换不了,那么肯定找不到pstring*,所以pstring*是错误的。
在编程时,常常需要把表达式的值赋值给变量,这就要求在声明变量的时候清楚地知道表达式的类型。然而有时候要做到这点并非那么容易,因此C++11给auto赋予了新的含义。
7.2 auto简介
在早期C/C++中auto的含义是:使用auto修饰的变量,是具有自动存储器的局部变量,但遗憾的是一直没有人去使用它。
C++11中,标准委员会赋予了auto全新的含义即:auto不再是一个存储类型指示符,而是作为一个新的类型指示符来指示编译器,auto声明的变量必须由编译器在编译时期推导而得。
int TestAuto() { return 10; } int main() { int a = 10; auto b = a; auto c = 'a'; auto d = TestAuto(); cout << typeid(b).name() << endl; cout << typeid(c).name() << endl; cout << typeid(d).name() << endl; //auto e; 无法通过编译,使用auto定义变量时必须对其进行初始化 return 0; }
我们发现,auto定义能够自动识别变量的类型。
【注意】
使用auto定义变量时必须对其进行初始化,在编译阶段编译器需要根据初始化表达式来推导auto的实际类型。因此auto并非是一种“类型”的声明,而是一个类型声明时的“占位符”,编译器在编译期会将auto替换为变量实际的类型。
7.3auto的使用细则
- 1.auto与指针和引用结合起来使用
用auto声明指针类型时,用auto和auto*没有任何区别,但用auto声明引用类型时则必须加&
int main() { int x = 10; auto a = &x; auto* b = &x; auto& c = x; cout << typeid(a).name() << endl; cout << typeid(b).name() << endl; cout << typeid(c).name() << endl; *a = 20; *b = 30; c = 40; return 0; }
- 2.在同一行定义多个变量
当在同一行声明多个变量时,这些变量必须是相同的类型,否则编译器将会报错,因为编译器实际只对第一个类型进行推导,然后用推导出来的类型定义其他变量。
void TestAuto() { auto a = 1, b = 2; auto c = 3, d = 4.0; // 该行代码会编译失败,因为c和d的初始化表达式类型不同 }
auto不能推导的场景
- auto不能作为函数的参数
- auto不能直接用来声明数组
- 为了避免与C++98中的auto发生混淆,C++11只保留了auto作为类型指示符的用法
- auto在实际中最常见的优势用法就是跟以后会讲到的C++11提供的新式for循环,还有lambda表达式等进行配合使用
基于范围的for循环(C++11)
范围for的语法
在C++98中如果要遍历一个数组,可以按照以下方式进行:
void TestFor() { int array[] = { 1, 2, 3, 4, 5 }; for (int i = 0; i < sizeof(array) / sizeof(array[0]); ++i) array[i] *= 2; for (int* p = array; p < array + sizeof(array)/ sizeof(array[0]); ++p) cout << *p << endl; }
对于一个有范围的集合而言,由程序员来说明循环的范围是多余的,有时候还会容易犯错误。因此C++11中引入了基于范围的for循环。for循环后的括号由冒号“ :”分为两部分:第一部分是范围内用于迭代的变量,第二部分则表示被迭代的范围。
范围for的使用条件
- for循环迭代的范围必须是确定的
对于数组而言,就是数组中第一个元素和最后一个元素的范围;对于类而言,应该提供begin和end的方法,begin和end就是for循环迭代的范围。
注意:以下代码就有问题,因为for的范围不确定
因为函数传数组,参数只能是指针,因此以指针为:后的条件是错误的。
- 迭代的对象要实现++和==的操作。 (由于水平有限,暂不做讨论)
总结
这篇很长的文章到这里就结束了,具体讲解了C++对于C语言不足之处的补充,其中的引用更是重中之重,C++的修炼之路将从这篇起始。