索引是什么|学习笔记

简介: 快速学习索引是什么

开发者学堂课程【MySQL 高级应用 - 索引和锁索引是什么】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址https://developer.aliyun.com/learning/course/598/detail/8591


索引是什么


目录

一、索引是什么

二、不进行物理删除


一、索引是什么

1MySQL 官方对索引的定义:

索引 (Index)是帮助 MySQL 高效获取数据的数据结构。可以得到索引的本质:索引是数据结构。

2、为什么建立索引

目的是为了提高查询效率,类比字典

如果数据量很多,只能按照下面示例查询

如果要查“mysql”这个单词,需要定位到 m 字母,然后从下往下找到 y 字母,再找到剩下的 sql

如果没有索引,可能需要 a----z ,如果想找到 Java 开头的单词或者 Oracle 开头的单词,就会减少效率。

3、索引的介绍

1)可以简单理解为"排好序的快速查找数据结构”

2)索引的两大功能

①查找速度快

②排好序

3)举例说明:

在图书馆中,可以问办理借阅处的人,需要找什么书,前台的人可以搜索那本书的位置,然后转告给找书人,不用一本一本去瞧是不是要借阅的书籍;如果没有索引,图书馆的书有又很多,只能一本本寻找需要借阅的书籍了。办理借阅处的人如同索引的作用,需要找的书就是数据。

4)下图就是一种可能的索引方式示例:

image.png

左边是数据表,一共有两列七条记录,最左边的是数据记录的物理地址;

右边可以理解成图书管理员使用图书检索系统,会告知你哪本书在什么位置。

比如要查找91号,0xF3 是真正记录的物理地址,对91进行二叉树查找,折半查询,进行重复查找。这样可以迅速找到,交给主人。

为了加快 Col2 的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以运用二叉查找在一定的复杂度内获取到相应数据,从而快速的检索出符合条件的记录。

5)索引的使用定义:

数据本身之外,数据库还维护着一个满足特定查找算法的数据结构,这些数据结构以某种方式指向数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引。

 

二、不进行物理删除

为了查数据更快,专门负责人每天需要备份、恢复、日志,最重要的是需要建立索引。

那为什么从逻辑上说东西已经删除,从物理上说并为被删除?

1.为了数据分析

现在已经进入到云计算和大数据时代,在一些后台会有客户浏览和客户下单的完整记录,所以说大部分是从使用状态变成非激活状态;

2.为了索引

比如:跟图书馆管理员说借一本《倚天屠龙记》,她告诉借书者在二楼三号柜,跑去看什么都没找到,这个时候的索引相当于报废状态。

对数据进行频繁的修改和删除,久而久之二叉查找树会失效;如果在使用索引时速度越来越慢,这时的索引就不是很准,箭头指向变多了也会影响索引。

数据稳定之后,按最新版再重建索引,重新构建再查会提升速度;在数据库里,改一条数据,除了改数据的记录以外,还要改它的索引,就会导致查询快,分散慢。所以不适合过于频繁的改数据。

3.修改

数据库里面改一条数据,也要同时修改索引。否则会导致索引指向不准确。

4.结论

一般来说索引本身也很大,不可能全部存储在内存中,因此索引往往以索引文件的形式存储在磁盘上。

5.JAVA 开发相关的索引

如果没有特别指明,都是指B(多路搜索树,并不一定是二叉的)结构组织的索引,其中聚集索引,次要索引,覆盖索引,复合索引,前缀索引,唯一索引默认都是使用 B+树索引,统称索引。当然,除了 B+树这种类型的索引之外,还有哈希索引(hash index)等。

相关实践学习
每个IT人都想学的“Web应用上云经典架构”实战
本实验从Web应用上云这个最基本的、最普遍的需求出发,帮助IT从业者们通过“阿里云Web应用上云解决方案”,了解一个企业级Web应用上云的常见架构,了解如何构建一个高可用、可扩展的企业级应用架构。
MySQL数据库入门学习
本课程通过最流行的开源数据库MySQL带你了解数据库的世界。   相关的阿里云产品:云数据库RDS MySQL 版 阿里云关系型数据库RDS(Relational Database Service)是一种稳定可靠、可弹性伸缩的在线数据库服务,提供容灾、备份、恢复、迁移等方面的全套解决方案,彻底解决数据库运维的烦恼。 了解产品详情: https://www.aliyun.com/product/rds/mysql 
相关文章
|
网络协议 网络安全
Powershell免杀(无文件落地免杀)
无文件落地 顾名思义,无需将恶意文件传到目标服务器/机器上,直接利用powershell的特性加载到内存执行。为了在红队行动中更隐蔽的实施攻击以及横向移动,同时还可以解决目标不出网只能通过dns上线时的棘手问题,利用powershell可以避免一行行echo。 通过两种方式进行无文件落地的免杀,一种是出网的情况,另一种为不出网情况。 声明: 文章内容仅供网络安全爱好者学习使用,请勿用文章中提到的技术或工具做违法的事情,否则后果自负。
1523 0
|
机器学习/深度学习 监控 TensorFlow
使用Python实现深度学习模型:智能森林火灾预警系统
使用Python实现深度学习模型:智能森林火灾预警系统
286 5
|
10月前
|
缓存 算法
函数递归超详解!
递归是解决许多计算机科学问题的强大工具。通过将问题分解为更小的子问题,递归提供了一种简洁且自然的解决方法。本文详细解释了递归的基本概念、类型、优缺点,并通过示例展示了如何应用递归解决实际问题。掌握递归技术对于编写高效、清晰的代码至关重要。希望本文能帮助读者更好地理解和应用递归,提升编程技巧。
398 8
|
数据采集 数据挖掘 大数据
数据处理利器:使用Pandas进行数据清洗与转换
【4月更文挑战第12天】在大数据时代,Pandas是Python数据分析的关键工具,提供高效的数据清洗和转换功能。本文介绍了如何使用Pandas处理缺失值(删除或填充)、异常值(Z-Score法和IQR法)以及重复值(检测和删除)。此外,还涵盖了数据转换,包括数据类型转换、数据标准化(Min-Max和Z-Score)以及类别数据的one-hot编码。通过学习这些方法,可以为数据分析和挖掘奠定坚实基础。
432 0
|
搜索推荐
哪些待办事项App能帮你提高工作效率?
本文介绍了五款受欢迎的待办事项软件:板栗看板、Todoist、Microsoft To Do、Any.do 和 Google Keep。它们各自具备独特的优势,如板栗看板的高效看板模式、Todoist的简洁任务管理、Microsoft To Do的微软生态整合、Any.do的日历整合与团队协作功能,以及Google Keep的简洁界面和云同步。这些工具能有效帮助个人和团队提高任务管理效率。
|
监控 数据可视化 安全
「译文」CMDB 最佳实践技术指南 -1-CMDB 可视化 - 最佳实践与示例
「译文」CMDB 最佳实践技术指南 -1-CMDB 可视化 - 最佳实践与示例
|
监控 网络协议 数据库
OSPF的区域类型介绍
OSPF的区域类型介绍
454 0
|
前端开发 JavaScript 新能源
【Echarts大屏】新能源汽车大屏(附源码一键复制)
【Echarts大屏】新能源汽车大屏(附源码一键复制)
|
Java Spring
[org.springframework.cloud.openfeign.FeignClientFactoryBean] is not eligible for getting processed by all BeanPostProcessors (for example: not eligible for auto-proxying)
这个日志信息是Spring框架中的一个`BeanPostProcessor`在启动时输出的。它在扫描应用程序中定义的所有Bean并将它们注册到应用程序上下文之前执行。然后,它检查每个Bean是否适合被所有`BeanPostProcessor`处理,也就是是否可以被动态代理拦截。
2043 1