6.[数据结构和算法分析笔记]堆 Heap

简介:

1.堆Heap

定义

堆是一颗安全二叉树,其结点含有Comparable的对象。在最大堆中,每个结点的对象都大于等于它的子孙结点中的对象。

1
2
3
4
5
6
7
8
public  interface  MaxHeapInterface<T  extends  Comparable<?  super  T>> {
     public  void  add(T newEntry);
     public  T removeMax();
     public  T getMax();
     public  boolean  isEmpty();
     public  int  getSize();
     public  void  clear();
}

2.用数组表示堆

用数组表示完全二叉树:一个完全二叉树在其倒数第二层以上是满的,并且其最后一层上的叶子结点是从左到右填满的。因此,指导最后一片叶子,完全二叉树中没有空洞。

如果一颗二叉树是完全的,使用数组而不是链表会更好。可以使用层序遍历将这棵二叉树的数据存放到一个数组中的连续位置。这种表示可以容易地找到一个结点的双亲或孩子中的数据。如果从数组的索引1开始存放二叉树,即跳过数组的第一个位置,则数组索引i处结点的:

双亲在索引i/2处,除非该结点是根节点(i为1);

子结点在索引2i与2i+1处。

MaxHeap

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
public  class  MaxHeap<T  extends  Comparable<?  super  T>>  implements
         MaxHeapInterface<T>, Serializable {
     private  T[] heap;  // 存放堆元素的数组
     private  int  lastIndex;  // 最后一个元素的索引
     private  static  final  int  DEFAULT_INITIAL_CAPACITY =  25 ;
     public  MaxHeap() {
         this (DEFAULT_INITIAL_CAPACITY);
     }
     public  MaxHeap( int  initialCapacity) {
         heap = (T[])  new  Comparable[initialCapacity +  1 ];
         lastIndex =  0 ;
     }
     // 插入元素
     public  void  add(T newEntry) {
         // 代码如下
     }
     public  T removeMax() {
         // 代码如下
     }
     public  T getMax() {
         T root =  null ;
         if  (isEmpty())
             root = heap[ 1 ];
         return  root;
     }
     public  boolean  isEmpty() {
         return  lastIndex <  1 ;
     }
     public  int  getSize() {
         return  lastIndex;
     }
     public  void  clear() {
         for  (; lastIndex > - 1 ; lastIndex--)
             heap[lastIndex] =  null ;
         lastIndex =  0 ;
     }
}

3.堆:插入元素

交换算法

避免交换

在数组索引10处有可用于新元素的空间,这个位置的双亲是位置10/2,即5,因而将新元素85与索引5处的内容30比较,由于85>30,所以将30移动到索引10处。

这时,在数组索引5处有可用于新元素的空间,这个位置的双亲是位置5/2,即2,则将新元素85与索引2处的内容80比较,由于85>80,所以讲80移动到索引5处。

这时,在数组索引2处有可用于新元素的空间,这个位置的双亲是位置2/2,即1,则将新元素85与索引1处的内容90比较,由于85<90,所以讲85插入索引2处。

为了将新元素插入堆,要从下一个可用于叶子的空闲位置开始。跟踪从该叶子到根的路径,直到找到新元素的正确位置。在这样做的同时,将元素从双亲向子结点移动以便最终为新元素腾出空间。

插入代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
public  void  add(T newEntry) {
     lastIndex++;
     if  (lastIndex >= heap.length) { // 数组heap已满
         // 将数组长度加倍
     }
     int  newIndex = lastIndex;  // 下一个空闲的数组位置的索引
     int  parentIndex = newIndex /  2 // 空闲位置的双亲的索引
     while  ((newIndex >  1 ) && newEntry.compareTo(heap[parentIndex]) >  0 ) {
         heap[newIndex] = heap[parentIndex];  // 将双亲移动到空闲位置
         newIndex = parentIndex;  //更新索引
         parentIndex = newIndex /  2 ;
     }
     heap[newIndex] = newEntry;  // 将新元素放到正确位置
}

4.堆:删除根

将半堆转化为堆

为了删除堆的根,首先用堆的最后一个子结点替换根,这一步骤形成一个半堆,因此要使用方法reheap将半堆转换为堆。

删除根算法


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
public  T removeMax() {
     T root =  null ;
     if  (!isEmpty()) {
         root = heap[ 1 ];  // 返回值
         heap[ 1 ] = heap[lastIndex];  // 形成半堆
         lastIndex--;  // 堆的大小减1
         reheap( 1 );  // 转化为堆
     }
     return  root;
}
private  void  reheap( int  rootIndex) {
     boolean  done =  false ;
     T orphan = heap[rootIndex];
     int  largerChildIndex =  2  * rootIndex;
     while  (!done && (largerChildIndex <= lastIndex)) {
         int  leftChildIndex = largerChildIndex;  // 等于根的子节点中较大者的索引
         int  rightChildIndex = leftChildIndex +  1 ;
         if  ((rightChildIndex <= lastIndex)
                 && heap[rightChildIndex].compareTo(heap[largerChildIndex]) >  0 )
             largerChildIndex = rightChildIndex;
         if  (orphan.compareTo(heap[largerChildIndex]) >  0 ) {
             heap[rootIndex] = heap[largerChildIndex];
             rootIndex = largerChildIndex;
             largerChildIndex =  2  * rootIndex;
         else
             done =  true ;
     }
     heap[rootIndex] = orphan;
}

5.堆:创建堆

使用add

从一组对象创建堆,可以使用add方法将每个对象插入到初始为空的堆中。这种方式创建堆是O(nlogn)

使用reheap

创建堆更高效的方式是使用reheap方法。先将堆的元素从索引1开始放进数组中,这个数组可以表示为一个完全二叉树,这棵二叉树含有可转化为堆的半堆,叶子结点是半堆,额也是堆。

使用reheap将一个数组的元素转化为堆,这种方式创建堆是O(n)

6.堆:堆排序

使用堆可以对数组排序。如果将数组元素放在一个最大堆中,将得到降序排序的元素。使用reheap而不是add,是从一个数组的元素创建堆的更高效方式。










本文转自 LinkedKeeper 51CTO博客,原文链接:http://blog.51cto.com/sauron/1227373,如需转载请自行联系原作者
目录
相关文章
|
2月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
51 1
|
2月前
|
机器学习/深度学习 算法 数据挖掘
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构
K-means聚类算法是机器学习中常用的一种聚类方法,通过将数据集划分为K个簇来简化数据结构。本文介绍了K-means算法的基本原理,包括初始化、数据点分配与簇中心更新等步骤,以及如何在Python中实现该算法,最后讨论了其优缺点及应用场景。
137 4
|
14天前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
50 20
|
2月前
|
存储 算法 搜索推荐
Python 中数据结构和算法的关系
数据结构是算法的载体,算法是对数据结构的操作和运用。它们共同构成了计算机程序的核心,对于提高程序的质量和性能具有至关重要的作用
|
2月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
2月前
|
算法
数据结构之路由表查找算法(深度优先搜索和宽度优先搜索)
在网络通信中,路由表用于指导数据包的传输路径。本文介绍了两种常用的路由表查找算法——深度优先算法(DFS)和宽度优先算法(BFS)。DFS使用栈实现,适合路径问题;BFS使用队列,保证找到最短路径。两者均能有效查找路由信息,但适用场景不同,需根据具体需求选择。文中还提供了这两种算法的核心代码及测试结果,验证了算法的有效性。
112 23
|
2月前
|
算法
数据结构之蜜蜂算法
蜜蜂算法是一种受蜜蜂觅食行为启发的优化算法,通过模拟蜜蜂的群体智能来解决优化问题。本文介绍了蜜蜂算法的基本原理、数据结构设计、核心代码实现及算法优缺点。算法通过迭代更新蜜蜂位置,逐步优化适应度,最终找到问题的最优解。代码实现了单链表结构,用于管理蜜蜂节点,并通过适应度计算、节点移动等操作实现算法的核心功能。蜜蜂算法具有全局寻优能力强、参数设置简单等优点,但也存在对初始化参数敏感、计算复杂度高等缺点。
64 20
|
2月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
65 1
|
2月前
|
机器学习/深度学习 算法 C++
数据结构之鲸鱼算法
鲸鱼算法(Whale Optimization Algorithm,WOA)是由伊朗研究员Seyedali Mirjalili于2016年提出的一种基于群体智能的全局优化算法,灵感源自鲸鱼捕食时的群体协作行为。该算法通过模拟鲸鱼的围捕猎物和喷出气泡网的行为,结合全局搜索和局部搜索策略,有效解决了复杂问题的优化需求。其应用广泛,涵盖函数优化、机器学习、图像处理等领域。鲸鱼算法以其简单直观的特点,成为初学者友好型的优化工具,但同时也存在参数敏感、可能陷入局部最优等问题。提供的C++代码示例展示了算法的基本实现和运行过程。
59 0
|
2月前
|
算法 vr&ar 计算机视觉
数据结构之洪水填充算法(DFS)
洪水填充算法是一种基于深度优先搜索(DFS)的图像处理技术,主要用于区域填充和图像分割。通过递归或栈的方式探索图像中的连通区域并进行颜色替换。本文介绍了算法的基本原理、数据结构设计(如链表和栈)、核心代码实现及应用实例,展示了算法在图像编辑等领域的高效性和灵活性。同时,文中也讨论了算法的优缺点,如实现简单但可能存在堆栈溢出的风险等。
60 0