【数据结构和算法】散列表的查找算法(开放地址法,链地址法)

简介: 【数据结构和算法】散列表的查找算法(开放地址法,链地址法)

散列表的基本概念


散列存储

image.png

散列方法(杂凑法)

image.png

散列函数(杂凑函数):散列方法中使用的转换函数

散列表(咋抽表):按上诉思想构造的表

image.png

冲突:不同的关键码映射到同一个散列地址

同义词:具有相同函数值的多个关键字就互称为同义词

image.png

(如上,23和9计算出来的散列地址一样,出现了冲突,并且其互称为同义词)


散列函数的构造


构造散列函数考虑的因素

image.png

构造散列函数的要求

image.png

散列函数的构造方法:直接定址法,数字分析法,平方取中法,折叠法,除留余数法,随机数法


1、直接定址法

image.png

(线性的函数值是必然没有重复冲突的,除非关键码相同)


2、除留余数法

image.png


散列函数冲突情况的处理


1、开放地址法(开地址法)

基本思想

image.png

增量序列的常用方法

image.png

  1. 线性探测法

image.png

用线性探测法处理冲突问题的示例:(增量不行+1,再不行再+1)

image.png

(散列表下面的数据表示为运算的次数,例如关键吗3的底下数字是4,表示如果要找到关键码3,需要进行4次的寻找)

平均查找长度的ASL的计算

如上所示,每一个关键码被找到的概率都是1/9,要寻找这些关键码的总次数为底下数字全部相加,sum = (1+2+1+1+1+4+1+2+2),所以ASL = sum/9 = (1+2+1+1+1+4+1+2+2)/9 = 1.67


  1. 二次探测法

用二次探测法处理冲突问题的示例:(增量不行+1,再不行再-1,再不行+4,再不行-4…)

image.png


  1. 伪随机探测法

方法和上两种方法类似,只不过产生出来的增量为一个伪随机数,这样就没有了规律可言,就不举例子了。

image.png


2、链地址法(拉链法)

基本思想:相同的散列地址的记录链成一个单链表

image.png

(如上所示便是散列表的链式存储结构)


链地址法构造散列表的步骤

image.png

链地址法的优点:

  1. 非同义词不会冲突,无“聚集”现象
  2. 链表上结点空间动态申请,更适合于表长不确定的情况


散列表的性能分析


  • 开发定址法与拉链法的比较
  1. 开放定址法

image.png

  1. 拉链法

image.png

  1. 无序表查找的ASL = (n+1)/2 = 6.5
  2. 有序表折半查找ASL = log2(n+1) - 1 = 2.多

(可见散列表的查找效率还是不错的)

影响散列表的因素

image.png

散列的平均查找长度ASL

image.png

  • 结论:
  1. 散列表技术具有很好的平均性能,优于一些传统的技术
  2. 链地址法优于开地址法
  3. 除留余数法作散列函数优于其他类型函数


参考链接:https://space.bilibili.com/40323036

目录
相关文章
|
3月前
|
算法 数据处理 C语言
C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合
本文深入解析了C语言中的位运算技巧,涵盖基本概念、应用场景、实用技巧及示例代码,并讨论了位运算的性能优势及其与其他数据结构和算法的结合,旨在帮助读者掌握这一高效的数据处理方法。
80 1
|
5天前
|
存储 机器学习/深度学习 算法
C 408—《数据结构》算法题基础篇—链表(下)
408考研——《数据结构》算法题基础篇之链表(下)。
70 29
|
5天前
|
存储 算法 C语言
C 408—《数据结构》算法题基础篇—链表(上)
408考研——《数据结构》算法题基础篇之链表(上)。
59 25
|
5天前
|
存储 人工智能 算法
C 408—《数据结构》算法题基础篇—数组(通俗易懂)
408考研——《数据结构》算法题基础篇之数组。(408算法题的入门)
52 23
|
30天前
|
存储 算法 测试技术
【C++数据结构——树】二叉树的遍历算法(头歌教学实验平台习题) 【合集】
本任务旨在实现二叉树的遍历,包括先序、中序、后序和层次遍历。首先介绍了二叉树的基本概念与结构定义,并通过C++代码示例展示了如何定义二叉树节点及构建二叉树。接着详细讲解了四种遍历方法的递归实现逻辑,以及层次遍历中队列的应用。最后提供了测试用例和预期输出,确保代码正确性。通过这些内容,帮助读者理解并掌握二叉树遍历的核心思想与实现技巧。
47 2
|
2月前
|
存储 运维 监控
探索局域网电脑监控软件:Python算法与数据结构的巧妙结合
在数字化时代,局域网电脑监控软件成为企业管理和IT运维的重要工具,确保数据安全和网络稳定。本文探讨其背后的关键技术——Python中的算法与数据结构,如字典用于高效存储设备信息,以及数据收集、异常检测和聚合算法提升监控效率。通过Python代码示例,展示了如何实现基本监控功能,帮助读者理解其工作原理并激发技术兴趣。
62 20
|
3月前
|
数据采集 存储 算法
Python 中的数据结构和算法优化策略
Python中的数据结构和算法如何进行优化?
|
3月前
|
并行计算 算法 测试技术
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面
C语言因高效灵活被广泛应用于软件开发。本文探讨了优化C语言程序性能的策略,涵盖算法优化、代码结构优化、内存管理优化、编译器优化、数据结构优化、并行计算优化及性能测试与分析七个方面,旨在通过综合策略提升程序性能,满足实际需求。
92 1
|
3月前
|
C语言
【数据结构】栈和队列(c语言实现)(附源码)
本文介绍了栈和队列两种数据结构。栈是一种只能在一端进行插入和删除操作的线性表,遵循“先进后出”原则;队列则在一端插入、另一端删除,遵循“先进先出”原则。文章详细讲解了栈和队列的结构定义、方法声明及实现,并提供了完整的代码示例。栈和队列在实际应用中非常广泛,如二叉树的层序遍历和快速排序的非递归实现等。
315 9
|
3月前
|
存储 算法
非递归实现后序遍历时,如何避免栈溢出?
后序遍历的递归实现和非递归实现各有优缺点,在实际应用中需要根据具体的问题需求、二叉树的特点以及性能和空间的限制等因素来选择合适的实现方式。
50 1