1.算法效率
1.1 如何衡量一个算法的好坏:
递归代码 ———— 斐波那契数列的代码量十分简洁,所以这个算法是很好的?但其实使用递归是不太好,计算第40位斐波那契数时要很长时间,原因是内部产生大量重复的计算。那该如何去衡量算法的优劣呢?
#define _CRT_SECURE_NO_WARNINGS #include<stdio.h> int Fib(int n) { if(n > 2) return Fib(n - 1) + Fib(n - 2); else return 1; } int main() { int n = 0; scanf("%d", &n); int ret = Fib(n); printf("第%d个斐波那契数是%d\n", n, ret); return 0; }
1.2 算法的复杂度
算法在编写成可执行程序后,运行时需要耗费时间资源和空间(内存)资源。
衡量一个算法的好坏,一般是从时间和空间两个维度来衡量的,即时间复杂度主要衡量一个算法的运行快慢,而空间复杂度主要衡量一个算法运行所需要的额外空间。在计算机发展的早期,计算机的存储容量很小。
所以对空间复杂度比较在乎。但是经过计算机行业的迅速发展,计算机的存储容量已经达到了很高的程度。所以我们如今已经不需要再特别关注算法的空间复杂度。
2.时间复杂度
2.1 什么是时间复杂度
算法的时间复杂度是一个函数,它描述了该算法的运行时间。
一个算法所花费的时间与其中语句的执行次数成正比,所以算法中的基本操作的执行次数,为算法的时间复杂度。即找到某条基本语句与问题规模N之间的数学表达式,就是算出了该算法的时间复杂度。
//计算fun1中++count语句总共执行了多少次 void Func1(int N) { int count = 0; for (int i = 0; i < N ; ++ i) { for (int j = 0; j < N ; ++ j) { ++count; } } for (int k = 0; k < 2 * N ; ++ k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
分析:
从上述代码中可以看出Func1的时间复杂度函数为F(N) = N * N + 2 * N + 10
▶ N = 10 F(N) = 130
▶ N = 100 F(N) = 10210
▶ N = 1000 F(N) = 1002010
从上述就可以看出N越大,对结果的影响就越小。实际中我们计算时间复杂度时,我们其实并不一定要计算精确的执行次数,而只需要大概执行次数,那么这里我们使用大O的渐进表示法 (估算)
2.2 大O渐进表示法 (估算)
大O符号 (Big O notation):用于描述函数渐近行为的数学符号
推导大O阶的方法:
1.用常数1取代运行时间中的所有加法常数
2.在修改后的运行次数函数中,只保留最高项3. 如果最高阶项存在且系数不是1,则去除与这个项相乘的系数,得到的结果就是大O阶
另外有些算法的时间复杂度存在最好,平均和最坏情况,例如:在一个长度为N的数组中查找一个数据X,最好的情况1次就找到;平均的情况N/2就找到;最坏的情况N次才找到
- 最坏情况:任意输入规模的最大运行次数(上界)
- 平均情况:任意输入规模的期望运行次数
- 最好情况:任意输入规模的最小运行次数(下界)
对于上面的Func1函数,使用大O的渐近表示法后,时间复杂度为O(N^2)
▶ N = 10 F(N) = 100
▶ N = 100 F(N) = 10000
▶ N = 1000 F(N) = 1000000
在实际中一般情况关注的是算法的最坏运行情况,所以数组中搜索数据时间复杂度为O(N)
2.3 常见的时间复杂度计算举例
2.3.1 实例1:
void Func2(int N) { int count = 0; for (int k = 0; k < 2 * N ; ++ k) { ++count; } int M = 10; while (M--) { ++count; } printf("%d\n", count); }
分析:
Func2的时间复杂度函数为F(N) = (2N + 10)
使用大O渐近表示法:保留影响最大的一项、去掉系数则为O(N)
2.3.2 实例2:
void Func3(int N, int M) { int count = 0; for (int k = 0; k < M; ++ k) { ++count; } for (int k = 0; k < N ; ++ k) { ++count; } printf("%d\n", count); }
分析:
Func3的时间复杂度函数为F(N) = (M + N)
使用大O渐近表示法:不一定只有一个未知数,所以这里可以写O(M + N)
也可以写成如下:
▶ O(max(M, N)):取M和N的较大值
▶ O(M):如果能说明M远大于N
▶ O(N):如果能说明N远大于M
▶ O(N)/O(M):如果能说明M和N差不多大
2.3.3 实例3:
void Func4(int N) { int count = 0; for (int k = 0; k < 100; ++k) { ++count; } printf("%d\n", count); }
分析:
Func4的时间复杂度函数为F(N) = (100)
使用大O渐近表示法:使用1代表常数,所以O(1)
2.3.4 实例4
void BubbleSort(int* a, int n) { assert(a); for (size_t end = n; end > 0; --end) { int exchange = 0; for (size_t i = 1; i < end; ++i) { if (a[i-1] > a[i]) { Swap(&a[i-1], &a[i]); exchange = 1; } } if (exchange == 0) break; } }
分析:
这是冒泡排序的一个优化版本,在一趟排序的过程中如果没有交换数据的话,它就会跳出循环
BubbleSort的时间复杂度函数为F(N) = ((n - 1) + (n - 2) … + 2 + 1)
发现这是一个等差数列,利用公式整合得:F(N) = n * n / 2 -> F(N) = N^2 / 2
使用大O渐近表示法:
(最坏情况):O(N^2) ->N^2的数量级
(平均情况):O(N^2) -> N^2 / 2
(最好情况):O(N)->只是比较了N-1次,本身就有序的时候
2.3.5 实例5:
//二分查找,折半查找(数组有序) int BinarySearch(int* a, int n, int x) { assert(a); int begin = 0; int end = n-1; while (begin < end) { int mid = begin + ((end-begin)>>1); if (a[mid] < x) begin = mid+1; else if (a[mid] > x) end = mid; else return mid; } return -1; }
分析:
BinarySearch依然存在最好、平均、最坏的情况:
BinarySearch的时间复杂度函数为F(N) = N / 2 / 2 / 2 … /2 = 1
使用大O渐近表示法:O(log₂N)或O(logN) -> 因为底数不好打出来,有时候一般也这样写
x:N / 2^x = 1 -> N = 2^x -> log₂N = x
(最坏情况):O(logN) ->找了一遍
(最好情况):O(1)->在中间位置
2.3.6 实例6:
long long Fac(size_t N) { if(0 == N) return 1;//0!=1 阶乘 return Fac(N-1)*N; }
每个里面是常数次,总共递归了n+1次
分析:
Fac的时间复杂度为F(N) = (N+1)
使用大O渐近表示法:O(N)
2.3.7 实例7:
long long Fib(size_t N) { if(N < 3) return 1; return Fib(N-1) + Fib(N-2); }
分析:
2^0 + 2^1 + 2^2 + 2^3 … +2^(N-3) + 2^(N-2)+ 2^(N-1)=等比数列-缺少常数
使用大O渐近表示法:O(2^N)
2.3.8 实例8
//计算strchr的时间复杂度 const char*strchr(const char*str,int character) while(*str) { if(*str==character) return str; str++; }
时间复杂度为O(N)
2.4 常见的复杂度对比