【C语言 - 数据结构】万字详解快速排序、归并排序(下)

简介: 【C语言 - 数据结构】万字详解快速排序、归并排序

4.2快排的优化二:小区间优化


为什么要用小区间优化,最重要的原因就是递归的程度越深,其被分成的数目越多,子问题越多,在此时我们可以利用插入排序进行优化。


1669442238750.jpg


代码示例:

void QuickSort4(int* a, int begin, int end)
{
  //子区间相等只有一个值或者不存在那么就是递归结束的子问题
  if (begin >= end)
  return;
  //小区间直接插入排序控制有序
  if (end - begin + 1 <= 10)
  {
  InsertSort(a + begin, end - begin + 1);//插入好多个区间
  }
  else
  {
  int keyi = PartSort3(a, begin, end);
  // [begin, keyi - 1]keyi[keyi + 1, end]
  QuickSort(a, begin, keyi - 1);
  QuickSort(a, keyi + 1, end);
  }
}


五、归并排序的概念


5.1归并排序的基本思想:


基本思想: 归并排序(MERGE-SORT)是建立在归并操作上的一种有效的排序算法,该算法是采用分治法(Divide and Conquer)的一个非常典型的应用。将已有序的子序列合并,得到完全有序的序列;即先使每个子序列有 序,再使子序列段间有序。若将两个有序表合并成一个有序表,称为二路归并。 归并排序核心步骤:


5.2归并排序的动态图:


2.gif


5.3归并排序的图解:


1669442285795.jpg

1669442294488.jpg

简而言之就是


小的放在新数组里


先分再归


六、归并排序的递归实现


6.1按照如下归并排序的基本思路实现代码


1669442312276.jpg


这是按照[begin, mid] 和[mid + 1, end]区间来划分的


如果是按照[begin, mid - 1]和[mid , end]这样分会分的不均匀,出现[1, 2]的中位数也是1,造成死循环,只要是数是奇数都会出现这种情况。


6.2写一段代码看归并排序的思路:


void _MergeSort(int* a, int begin, int end, int* tmp)
{
  if (begin >= end)
  {
  return;
  }
  int mid = (begin + end) / 2;
  //[begin, mid - 1], [mid, end]
  _MergeSort(a, begin, mid, tmp);
  _MergeSort(a, mid + 1, end, tmp);
  printf("归并[%d, %d][%d, %d]\n", begin, mid, mid + 1, end);
}

归并排序的具体过程

1669442344010.jpg

归并排序的递归搜索树图


1669442352247.jpg


归并排序的递归函数代码如下:

//借助子函数
void _MergeSort(int* a, int begin, int end, int* tmp)
{
  if (begin >= end)
  {
  return;
  }
  int mid = (begin + end) / 2;
  //[begin, mid - 1], [mid, end]
  _MergeSort(a, begin, mid, tmp);
  _MergeSort(a, mid + 1, end, tmp);
  //printf("归并[%d, %d][%d, %d]\n", begin, mid, mid + 1, end);
  int begin1 = begin, end1 = mid;
  int begin2 = mid + 1, end2 = end;
  int index = begin;//相当于是每一个区间的开始都是begin
  while (begin1 <= end1 && begin2 <= end2)
  {
  if (a[begin1] < a[begin2])
    tmp[index++] = a[begin1++];
  else
    tmp[index++] = a[begin2++];
  }
  //如果还有谁没结束,就把谁放tmp的后面
  while (begin1 <= end1)
  tmp[index++] = a[begin1++];
  while (begin2 <= end2)
  tmp[index++] = a[begin2++];
  //把tmp里的数拷贝回a数组
  //y总是用for循环实现的
  memcpy(a+begin, tmp+begin, (end - begin + 1) * sizeof(int));
}
void MergeSort(int* a, int n)
{
    int* tmp = (int*)malloc(sizeof(int) * n);
    assert(tmp);
    _MergeSort(a, 0, n - 1, tmp);
    free(tmp);
};


七、归并排序的非递归实现以及归并排序的模板


7.1归并排序递归改非递归的思路:


思路:用循环,人为设置一个gap间隙


刚开始gap = 1,后面gap呈2倍增长


直到gap = 数组长度时结束


gap的作用就相当于划分区间了,每次划分完就排序每个区间,排完就拷贝回原数组


1669442376030.jpg


递归改非递归思路虽然简单但是区间的边界控制还是很伤脑筋的,和gap有关的区间边界都要控制,原因:gap突变太快了,跟gap有关的全部都存在越界访问的风险,这一点算是递归改非递归的难点,这点需要我们取突破。个人觉得这个有点像希尔排序对插入排序的优化,使用了gap间隙,使效率得到大大的提升,但是两者还是有细微区别的。


7.2归并排序递归改非递归的代码实现:


void MergeSortNonR(int* a, int n)
{
    int* tmp = (int*)malloc(sizeof(int) * n);
    int gap = 1;
    while(gap < n)
    { 
        //间距为gap是一组,两两归并
        for (int i = 0; i < n; i+= gap*2)
        {
            int begin1 = i, end1 = i + gap -1 ;
            int begin2 = i + gap, end2 = i + 2*gap - 1;
            //end1越界,修正
            if (end1 >= n)
                end1 = n - 1;
            //begin2越界,第二个区间不存在,修正成不存在的区间
            if (begin2 >= n)
            {
                begin2 = n;
                end2 = n - 1;
            }
            //begin2 ok, end2越界,修正2即可
            if (begin2 < n && end2 >= n)
                end2 = n - 1;
            //  条件断点
            if (begin1 == 8 && end1 == 9
                && begin2 == 9 && end2 == 9)
            {
                int x = 0;
            }
            int index = i;
            while (begin1 <= end1 && begin2 <= end2)
            {
                if (a[begin1] < a[begin2])
                    tmp[index++] = a[begin1++];
                else
                    tmp[index++] = a[begin2++];
            }
            //如果还有谁没结束,就把谁放tmp的后面
            while (begin1 <= end1)
                tmp[index++] = a[begin1++];
            while (begin2 <= end2)
                tmp[index++] = a[begin2++];
        }
        memcpy(a, tmp, n * sizeof(int));
        gap *= 2;
    }
    free(tmp);
}


7.3介绍一种比较好找bug 的调试方法:条件断点法


作用:调试时可以直接使程序停在想要的位置,从而提升调试效率


1669442403989.jpg


比如说我们想让程序停在出问题的归并[8, 9][9, 9]这个区域,我们只需写一段代码,然后将断点打在这个位置:

if (begin1 == 8 && end1 == 9
                && begin2 == 9 && end2 == 9)
            {
                int x = 0;
            }


7.4归并排序的模板(竞赛用)


#include<iostream>
using namespace std;
const int N = 100010;
int n;
int q[N], tmp[N];
void merge_sort(int q[], int l, int r)
{
    if(l >= r) return;// 特判区间内如果只有一个数或者为空时,直接return;
    int mid = l + r >> 1;//确定分界点mid
    merge_sort(q, l, mid), merge_sort(q, mid+1, r);//递归排序两边
    int k = 0, i = l, j = mid + 1;
    while(i <= mid && j <= r)//归并,合并两边
        if(q[i] <= q[j]) tmp[k++] = q[i++];
        else tmp[k++] = q[j++];
        while(i <= mid) tmp[k++] = q[i++];//再次查看左边区间是否还有剩余
        while(j <= r) tmp[k++] = q[j++];//再次查看右边区间是否还有剩余
        for (i = l, j = 0; i <= r; i++, j++) q[i] = tmp[j];//把tmp[i] 存到q[j]里
}
int main ()
{
    scanf("%d", &n);
    for(int i = 0; i < n; i++) scanf("%d", &q[i]);
    merge_sort(q, 0, n - 1);
    for(int i = 0; i < n; i++) printf("%d ", q[i]);
    return 0;
}


八、两种排序的对比总结


8.1快速排序的特性总结


快速排序的特性总结: 1. 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序


2. 时间复杂度:O(N*logN)


3. 空间复杂度:O(logN)


4. 稳定性:不稳定


8.2归并排序的特性总结


归并排序的特性总结: 1. 归并的缺点在于需要O(N)的空间复杂度,归并排序的思考更多的是解决在磁盘中的外排序问题。


2. 时间复杂度:O(N*logN)


3. 空间复杂度:O(N)


4. 稳定性:稳定


8.3快速排序的时间、空间复杂度分析(来自书籍)


快速排序的一次划分Parttion算法两头交替搜索,直到两段区间重合,时间复杂度是O(N),整个快速排序的时间复杂度与划分的趟数有关,也就是说,快速排序的时间性能取决于快速排序递归的深度,如果是划分过程比较均匀, 递归树是平衡的,此时性能较好。在最优的情况下,划分Parttion每次都比较均匀,如果排序n个关键字,递归的搜索深度为log(n),这样整个算法的时间复杂度是O(nlogn)的。


如果是在有序的情况下,长度为n的数据表要经过N次划分,此时的时间复杂度为o(N^2),如果是用三数取中,可以降低其时间复杂度。


快排的空间复杂度分析:从空间性能上看,尽管快速排序需要一个元素的辅助空间,由于快速排序是递归的,每层递归调用时的指针和参数均要栈来存放,存储开销在理想的情况下为O(logN);在最坏的情况下为O(N)。


另外,快速排序过程中的关键词相同的元素在排序前后相对位置发生了改变,因此,快速排序是不稳定的排序算法。


8.4归并排序的时间、空间复杂度分析


归并排序是分治思想的最典型的例子,上面的算法中,对一组数a[n]进行排序,先将它分为[begin, mid] 和[mid + 1, end]区间来划分的,分别通过递归调用将他们单独排序,最终将有序的子数组归并为最终的排序结果。具有N个记录的序列进行归并排序的递归的深度就是具有n个结点的完全二叉树的深度,可以看出来整个排序归并排序需要进行log(N)次,因此,总的归并排序算法的时间复杂度为O(logN),而且这是归并排序算法最好、最坏、平均的时间复杂度。


由于归并排序在归并过程中需要与原始记录序列同样数量的存储空间存放归并结果以及递归时深度为logn的栈空间,因此,空间复杂度为O(n + logn)。


非递归的合并排序避免了递归时深度为logn 的栈空间,空间只是用到了申请归并临时用的tmp数组,因此,时间复杂度为O(n),在时间上也有一定的提升,省去了递归拆分,但总体时间复杂度还是O(logn)。应该说,使用归并排序时,尽量考虑非递归的方法。


8.5快速排序和归并排序测试用时


数据量为10万时,不分伯仲(release版本)


1669442465024.jpg


数据量为100万时(release版本)


1669442480810.jpg


数据量为1000万时(release版本)


1669442490023.jpg

相关文章
|
2月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
68 1
|
2月前
|
存储 算法 搜索推荐
【趣学C语言和数据结构100例】91-95
本文涵盖多个经典算法问题的C语言实现,包括堆排序、归并排序、从长整型变量中提取偶数位数、工人信息排序及无向图是否为树的判断。通过这些问题,读者可以深入了解排序算法、数据处理方法和图论基础知识,提升编程能力和算法理解。
69 4
|
2月前
|
存储 机器学习/深度学习 搜索推荐
【趣学C语言和数据结构100例】86-90
本文介绍并用C语言实现了五种经典排序算法:直接插入排序、折半插入排序、冒泡排序、快速排序和简单选择排序。每种算法都有其特点和适用场景,如直接插入排序适合小规模或基本有序的数据,快速排序则适用于大规模数据集,具有较高的效率。通过学习这些算法,读者可以加深对数据结构和算法设计的理解,提升解决实际问题的能力。
55 4
|
12天前
|
存储 人工智能 算法
【C++数据结构——内排序】二路归并排序(头歌实践教学平台习题)【合集】
本关任务是实现二路归并算法,即将两个有序数组合并为一个有序数组。主要内容包括: - **任务描述**:实现二路归并算法。 - **相关知识**: - 二路归并算法的基本概念。 - 算法步骤:通过比较两个有序数组的元素,依次将较小的元素放入新数组中。 - 代码示例(以 C++ 为例)。 - 时间复杂度为 O(m+n),空间复杂度为 O(m+n)。 - **测试说明**:平台会对你编写的代码进行测试,提供输入和输出示例。 - **通关代码**:提供了完整的 C++ 实现代码。 - **测试结果**:展示代码运行后的排序结果。 开始你的任务吧,祝你成功!
30 10
|
12天前
|
搜索推荐 C++
【C++数据结构——内排序】快速排序(头歌实践教学平台习题)【合集】
快速排序是一种高效的排序算法,基于分治策略。它的主要思想是通过选择一个基准元素(pivot),将数组划分成两部分。一部分的元素都小于等于基准元素,另一部分的元素都大于等于基准元素。然后对这两部分分别进行排序,最终使整个数组有序。(第一行是元素个数,第二行是待排序的原始关键字数据。本关任务:实现快速排序算法。开始你的任务吧,祝你成功!
31 7
|
2月前
|
存储 缓存 算法
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式
在C语言中,数据结构是构建高效程序的基石。本文探讨了数组、链表、栈、队列、树和图等常见数据结构的特点、应用及实现方式,强调了合理选择数据结构的重要性,并通过案例分析展示了其在实际项目中的应用,旨在帮助读者提升编程能力。
87 5
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
82 1
|
2月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
284 9
|
2月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
44 1
|
12天前
|
存储 C语言 C++
【C++数据结构——栈与队列】顺序栈的基本运算(头歌实践教学平台习题)【合集】
本关任务:编写一个程序实现顺序栈的基本运算。开始你的任务吧,祝你成功!​ 相关知识 初始化栈 销毁栈 判断栈是否为空 进栈 出栈 取栈顶元素 1.初始化栈 概念:初始化栈是为栈的使用做准备,包括分配内存空间(如果是动态分配)和设置栈的初始状态。栈有顺序栈和链式栈两种常见形式。对于顺序栈,通常需要定义一个数组来存储栈元素,并设置一个变量来记录栈顶位置;对于链式栈,需要定义节点结构,包含数据域和指针域,同时初始化栈顶指针。 示例(顺序栈): 以下是一个简单的顺序栈初始化示例,假设用C语言实现,栈中存储
128 75

热门文章

最新文章