什么是数据结构和算法?

简介: 什么是数据结构和算法?

一、什么是数据结构和算法?
正如封清扬所言:数据结构是一门费脑子的课,你若遇到困惑不解的地方,都是正常的,就像你乘飞机去旅行,在飞机场晚点几个钟头,上了飞机又颠簸恐慌一样,别大惊小怪,都很平常,只要能安全到达就是成功。

  1. 数据结构的起源

早期的计算机可以简单理解为数值计算的工具,就是用来计算的。可现实中,我们更多的不是解决数值计算的问题,而是需要一些更科学有效的手段(比如表、树、图等数据结构)的帮助,才能更好的去处理问题。
数据结构: 是相互之间存在一种或多种特定关系的数据元素的集合.
也就有了后面我们所说的,程序设计 = 数据结构 + 算法

  1. 算法是什么?

现在我们写一下1 + 2 + 3 + … + 100,大多数人都会写下以下的代码:

public static void main(String[] args) {

    int sum = 0;
    for (int i = 1; i <= 100; i++) {
        sum += i;
    }
    System.out.println(sum);
}

1
2
3
4
5
6
7

小学时候的高斯在老师出这道题时,很快就得到了答案:5050,老师特别吃惊,问道为何能如此快得到答案?
高斯解释道:

public static void main(String[] args) {

    int sum = 0;
    int n = 100;
    sum = (1 + n) * n / 2;
    System.out.println(sum);
}

1
2
3
4
5
6
同一问题,两种不同的解法,当数据量上升后,差异还是很明显的。
算法:算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指定表示一个或多个操作。

二、算法效率的度量方法
事后统计法:这种方法主要是通过设计好的测试程序和数据,利用计算机计时器对不同算法编制的程序运行时间进行比较,从而确定算法效率的高低。
事前分析估算法: 在计算机程序编制之前,依据统计方法对算法进行估算。
一个程序的运行时间,依赖于算法的好坏和问题的输入规模,所谓问题的输入规模就是指输入量的多少
第一种算法:
public static void main(String[] args) {

    int sum = 0;                     //1次
    for (int i = 1; i <= 100; i++) { //n+1次
        sum += i;                    //n次
    }
    System.out.println(sum);         //1次  
}

1
2
3
4
5
6
7
第二种算法:

public static void main(String[] args) {

    int sum = 0, n = 100;   //1次
    sum = (1 + n) * n / 2;  //1次
    System.out.println(sum); //1次
}

1
2
3
4
5
显然,第一种算法执行了1+(n+1)+n+1次 = 2n+3次;第二种算法 1+1+1 = 3次,其实第一条和最后一条两个算法是一样的,我们只关注循环那部分,两个算法其实是n 和 1的差距。算法好坏显而易见。

三、时间复杂度
一般情况下,算法中基本操作重复执行的次数是问题规模n的某个函数,用T(n)表示,若有某个辅助函数f(n),使得当n趋近于无穷大时,T(n)/f (n)的极限值为不等于零的常数,则称f(n)是T(n)的同数量级函数。记作T(n)=O(f(n)),称O(f(n)) 为算法的渐进时间复杂度,简称时间复杂度。

一般情况下,随着n的增大,T(n)增长最慢的算法为最优算法。

  1. 推导大O阶方法

那么如何分析一个算法的时间复杂度呢?即如何推导大O阶呢?我们给出了下面的方法:

1、用常数1取代运行时间中的所有加法常数。
2、在修改后的运行次数函数中,只保留最高阶项。
3、如果最高阶项存在且不是1,则去除与这个项目相乘的常数。得到的结果就是大O阶。

  1. 常数阶

我们刚刚的第二种算法(高斯算法),为什么时间复杂度不是O(3),而是O(1)

public static void main(String[] args) {

    int sum = 0, n = 100;   //1次
    sum = (1 + n) * n / 2;  //1次
    System.out.println(sum); //1次
}

1
2
3
4
5
这个算法执行了3次。根据我们的大O阶的方法,第一步就是将常数项3改为1,它根本没有最高阶项,所以这个算法的时间复杂度是O(1)
注意:不管这个常数是多少,我们都记做O(1),而不能是O(3)、O(100)等其他任何数字。

  1. 线性阶

线性阶的循环结构往往会复杂很多。要确定某个算法的阶次,我们常常需要确定某个特定语句。我们要分析算法的复杂度,关键就是要分析循环的运行情况。

int i = 0;
for (i = 0; i < n; i++) {

     //时间复杂度为O(1)的步骤序列   
 }

1
2
3
4
下面这段代码,它的循环的时间复杂度是O(n),因为循环体中的代码需要执行n次

  1. 对数阶

下面这段代码,时间复杂度又是多少呢?

    int count = 1;
    while(count < n) {
        count = count * 2;
    }

1
2
3
4
由于每次count乘以2之后,就距离n更近一分,也就是说,有多少个2相乘后大于n,则会退出循环.由2^x = n得到x = logn。所以这个循环的时间复杂度是O(longn)

  1. 平方阶

下面例子是一个循环嵌套,它的内循环刚才我们已经分析过,时间复杂度为O(n)。

    for (int i = 0; i < n; i++) {
        for (int j = 0; j < n; j++) {
            //时间复杂度为O(1)的步骤序列 
        }
    }

1
2
3
4
5
由于外层的循环,不过是内部这个时间复杂度为O(n)的语句,在循环n次,所以这段代码的时间复杂度是O(n²).

    for (int i = 0; i < m; i++) {
        for (int j = 0; j < n; j++) {
            //时间复杂度为O(1)的步骤序列 
        }
    }

1
2
3
4
5
如果外层循环次数变成了m,时间复杂度就变成了O(n×m)。

  1. 时间复杂度练习

习题1

    for (int i = 0; i < n; i++) {
        for (int j = i; j < n; j++) {
            
        }
    }

1
2
3
4
5
总的执行次数为:n+(n-1)+(n-2)+…+1 = n*(n+1)/2 = n²/2+n/2
用我们推导大O的方法,第一条,没有加法常数不考虑,第二条只保留最高项,因此保留 n²/2,第三条去除系数,所以最终的时间复杂度是O(n²)。
习题2

public static void fun(int N,int M) {

    int count = 0;
    for (int i = 0; i < N; i++) {
        count++;
    }
    for (int i = 0; i < M; i++) {
        count++;
    }
}

1
2
3
4
5
6
7
8
9
一共执行N+M次,按照大O推导法,最终时间复杂度为O(N+M)
习题3

public static void main(String[] args) {

    int count = 0;
    for (int i = 0; i < 1000; i++) {
        count++;
    }
}

1
2
3
4
5
6
循环一共执行1000次,按照大O推导法,常数变为1,最终的时间复杂度为O(1)
习题4
二分查找的时间复杂度为多少?

public static int binarySearch(int[] arr,int k) {

    int left  = 0;
    int right = arr.length - 1;
    while(left <= right) {
        int mid = (left + right) / 2;
        if(arr[mid] > k) {
            right = mid - 1;
        }else if(arr[mid] < k) {
            left = mid + 1;
        }else {
            return mid;   
        }
    }
    return -1;
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
二分查找每次排除掉一半的不适合值,一次二分剩下:n/2 两次二分剩下:n/2/2 = n/4,所以按照推导2^x = n得到x = logn。所以二分查找的时间复杂度是O(longn)
习题5
下面递归阶乘的时间复杂度为多少?

public static int factorial(int n) {

    if(n < 2) {
        return n;
    }else {
        return factorial(n - 1) * n;
    }
}

1
2
3
4
5
6
7

我们以n = 3为例,发现递归执行了3次,所以时间复杂度为O(n).
习题6
下面递归斐波那契数列的时间复杂度为多少?

public static int factorial(int n) {

    if(n < 2) {
        return n;
    }else {
        return factorial(n - 1) + factorial(n - 2);
    }
}

1
2
3
4
5
6
7

我们发现在递归的过程中,此处执行的次数是一个以1为首项,2为公比的等比数列之和.时间复杂度为O(2^n).

  1. 最坏情况与平均情况

比如·我们在查找一个有n个随机数字的数组中查找某个数字,最好的情况是一次找到,它的时间复杂度为O(1),也有可能最后一次找到,时间复杂度为O(n)。
一般在没有特殊说明的情况下,都是指最坏的时间复杂度
平均运行时间是所有情况中最有参考意义的,因为它是期望的运行时间。

四、空间复杂度
空间复杂度是对一个算法在运行过程中临时占用存储空间大小的量度 。空间复杂度不是程序占用了多少bytes的空间,因为这个也没太大意义,所以空间复杂度算的是变量的个数。空间复杂度计算规则基本跟实践复杂度类似,也
使用大O渐进表示法
因为我们现在电脑的内存和以往相比大了很多,现在我们更多的是追求时间,经常会出现空间换取时间的技巧。当不用限定词的使用"复杂度"时,通常都是指时间复杂度
练习1:

public static void bubbleSort(int[] arr) {

    for (int i = 0; i < arr.length - 1; i++) {
        boolean flg = true;
        for (int j = 0; j < arr.length - i -1; j++) {
            if(arr[j] > arr[j+1]) {
                int h = arr[j];
                arr[j] = arr[j+1];
                arr[j+1] = h;
                flg = false;
            }
        }
        if(flg == true) {
            break;
        }
    }
}

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
我们发现在第一层循环里,创建了一个flg变量,但每次循环完之后都会销毁掉之前的,重新创建,相当于只创建了一个,所以空间复杂度为O(1).
练习2:

public static int[] func(int n) {

    int[] arr = new int[n + 1];
    arr[0] = 0;
    arr[1] = 1;
    for (int i = 2; i <= n; i++) {
        arr[i] = arr[i-1] + arr[i-2];
    }
    return arr;
}

1
2
3
4
5
6
7
8
9
我们可以发现额外创建了一个长度为n+1的数组,所以空间复杂度为O(n)
练习3:

public static int factorial(int n) {

    if(n < 2) {
        return n;
    }else {
        return factorial(n - 1) * n;
    }
}

1
2
3
4
5
6
7

我们发现它会递归开辟n个空间,所以时间复杂度为O(n)
练习4:

public static int factorial(int n) {

    if(n < 2) {
        return n;
    }else {
        return factorial(n - 1) + factorial(n - 2);
    }
}

1

相关文章
|
12天前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
23 1
|
16天前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
58 4
|
2月前
|
存储 人工智能 算法
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
这篇文章详细介绍了Dijkstra和Floyd算法,这两种算法分别用于解决单源和多源最短路径问题,并且提供了Java语言的实现代码。
90 3
数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。
|
13天前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
13天前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
21天前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
82 23
|
21天前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
55 20
|
12天前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
37 1
|
21天前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
42 0
|
21天前
|
算法 vr&ar 计算机视觉
数据结构之洪水填充算法(DFS)
洪水填充算法是一种基于深度优先搜索(DFS)的图像处理技术,主要用于区域填充和图像分割。通过递归或栈的方式探索图像中的连通区域并进行颜色替换。本文介绍了算法的基本原理、数据结构设计(如链表和栈)、核心代码实现及应用实例,展示了算法在图像编辑等领域的高效性和灵活性。同时,文中也讨论了算法的优缺点,如实现简单但可能存在堆栈溢出的风险等。
35 0