浅谈sort函数底层（一道c++面试的天坑题）-阿里云开发者社区

浅谈sort函数底层（一道c++面试的天坑题）

2024-04-15 589

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 浅谈sort函数底层（一道c++面试的天坑题）

浅谈sort函数底层

sort函数的底层用到的是内省式排序以及插入排序，那么什么是内省式排序呢？和插入排序又是如何组合的呢？

根据维基百科描述：内省排序（英语：Introsort）是由David Musser在1997年设计的排序算法。这个排序算法首先从快速排序开始，当递归深度超过一定深度（深度为排序元素数量的对数值）后转为堆排序。

先来回顾一下以上提到的3中排序方法：

快速排序：先选一个基准值（一般为首值），将比它大的数置于其右侧，将比它小的数置于它左侧，那么这个基准值所在的位置定是整个数组的有序位。然后递归该基准左右两子数组。算法复杂度为nlogn；

堆排序：将数组建立成大顶堆，重复从堆顶取出数值最大的结点(把根结点和最后一个结点交换，把交换后的最后一个结点移出堆，移出的这个数值为未排序数组的最后)，并让残余的堆维持大顶堆的性质。时间复杂度为nlogn；

插入排序：对于未排序数据，在已排序序列中从后向前扫描，找到相应位置并插入。时间复杂度为n2;

其中先讲下快排和堆排，快排的平均复杂度为nlogn，但是它的复杂度是根据基准值来决定的，基准值选择的不好，最坏的复杂度会达到n2，而堆排序的复杂度是一定的为nlogn，那为什么不直接使用堆排序呢，是因为在将堆顶值与最后一个结点值交换并移除最后一个值后，在重新建堆的过程中，交换到堆顶的值显然比每个结点要小，但还是要经过对比判断，这个判断其实是多余的，因此这是它相比快排较慢的原因。

于是，内省式排序结合了快排和堆排的特点，当快速排序到大一定深度（2logn）时，采用堆排序，以维持nlogn的复杂度。

在sort函数中，内省排序过程中子数组长度小于16时，采用的是插入排序，为什么呢？因为当数组长度较短时，就是数组已经大致排序过了，对大致有序的数组（即逆序对不多了）用插入排序的算法复杂度会很小，可以想象成理牌的过程。

让我们看一下sort函数的底层代码：

inline void
    __sort(_RandomAccessIterator __first, _RandomAccessIterator __last,
     _Compare __comp)
    {
      if (__first != __last)
  {
  //sort函数默认为内省排序，当子数组小于16时返回
    std::__introsort_loop(__first, __last,
        std::__lg(__last - __first) * 2,
        __comp);
  //对大致排序过的数组进行插入排序操作
    std::__final_insertion_sort(__first, __last, __comp);
  }
    }

内省排序：

void
    __introsort_loop(_RandomAccessIterator __first,
         _RandomAccessIterator __last,
         _Size __depth_limit, _Compare __comp)
    {
    //当子数组长度<=16就返回，返回之后就会执行上一组代码的插入排序
      while (__last - __first > int(_S_threshold))
  {
  //控制深度，快排深度达2logn时，进行堆排序
    if (__depth_limit == 0)
      {
        std::__partial_sort(__first, __last, __last, __comp);
        return;
      }
    --__depth_limit;
   //这里进行了基准值的选择和简单的交换
    _RandomAccessIterator __cut =
      std::__unguarded_partition_pivot(__first, __last, __comp);
   //对右子数组进行内省排序
    std::__introsort_loop(__cut, __last, __depth_limit, __comp);
   //对左子数组进行while循环（这里很巧的避免了一次内省函数的调用，节省了时间）
    __last = __cut;
  }
    }

综上所述，sort函数的底层不只是快速排序，而是由内省排序和插入排序的组合，这也解释了为什么当数组长度短的时候，sort函数是稳定的排序，而当数组长度较大时，排序要记录元素的游标值记录避免快排引起的不稳定排序。

浅谈sort函数底层（一道c++面试的天坑题）

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

浅谈sort函数底层（一道c++面试的天坑题）

热门文章

最新文章

相关课程

相关电子书