索引

首页 标签 索引
# 索引 #
关注
66735内容
ES6框架
本文详解ES6开发环境搭建(Webpack+Rollup)、模块化演进、class与构造函数区别、Promise原理实现及async/await等核心特性,深入剖析箭头函数与普通函数的8大差异,涵盖Proxy响应式原理、数组方法及ES Module规范,助力掌握现代JavaScript开发精髓。(239字)
最近邻检索(下):如何用乘积量化实现「拍照识花」功能?
AI时代,图片检索依赖高效向量相似性计算。通过CNN提取图像特征后,需解决高维向量的快速检索与存储问题。聚类算法(如K-Means)比局部敏感哈希更精准,能保留语义相似性;乘积量化则大幅压缩向量存储空间。结合聚类、乘积量化与倒排索引,可实现海量图片的高效近似最近邻搜索,广泛应用于以图搜图、商品识别、推荐系统等场景。
存储系统:从检索技术角度剖析 LevelDB 的架构设计思想
LevelDB是Google开源的高性能键值存储系统,基于LSM树优化,通过跳表、读写分离、SSTable分层与Compaction等机制,高效管理内存与磁盘数据。结合BloomFilter、索引分离和LRU缓存,显著提升读写与检索性能,广泛应用于工业级系统。(239字)
索引更新:刚发布的文章就能被搜到,这是怎么做到的?
本文介绍工业界倒排索引的高效更新机制。针对小规模内存索引,采用Double Buffer实现无锁读写;对于大规模数据,则使用“全量+增量”索引结合方案,配合删除列表处理删改操作,并通过滚动合并法减少冗余IO,提升系统性能与可扩展性。(238字)
索引构建:搜索引擎如何为万亿级别网站生成索引?
针对超大规模数据,可通过分治与多路归并生成内存外倒排索引。先将文档分批在内存建索引,再写入有序临时文件,最后合并为全局索引。检索时结合内存哈希表、B+树及分层加载技术,高效处理词典与 posting list 的磁盘访问,提升查询性能。
测一测丨检索算法基础,你掌握了多少?
本题库涵盖数组、链表、二叉检索树、跳表、哈希表、位图、布隆过滤器及倒排索引等数据结构的查询效率、空间代价与应用场景,深入解析各类结构在有序/无序、平衡/非平衡状态下的时间复杂度与适用场景,对比不同索引机制的优劣,帮助理解数据存储与检索的核心原理。
空间检索(上):如何用 Geohash 实现「查找附近的人」功能?
本文介绍了如何高效实现“查找附近的人”功能,提出基于空间划分与Geohash编码的检索方案。通过将二维坐标转为一维编码,结合区域索引与邻近区域扩展,可在大规模系统中快速实现精准或非精准查询,适用于社交、出行等场景。
特别加餐 | 高性能检索系统中的设计漫谈
本文系统梳理了高性能检索系统中的四大核心设计思想:索引与数据分离、减少磁盘IO、读写分离和分层处理。通过典型案例对比与深入分析,揭示其本质与通用经验,帮助开发者在实际场景中权衡利弊,构建高效、稳定的系统架构,提升整体性能。
非精准 Top K 检索:如何给检索结果的排序过程装上加速器?
本文介绍了非精准 Top K 检索的优化思路与实现方法,旨在通过简化打分过程提升检索性能。重点讲解了三种加速策略:基于静态质量得分排序截断、利用词频构建胜者表、以及分层索引设计。这些方法将计算前置到离线阶段,在线仅做快速截断,大幅降低开销。结合精准排序的两阶段架构(召回+排序),可在保证结果质量的同时显著提升效率,广泛应用于搜索与推荐系统中。
数据库检索:如何使用 B+ 树对海量磁盘数据建立索引?
本讲探讨磁盘环境下大规模数据检索的挑战与解决方案,重点解析B+树如何通过索引与数据分离、多阶平衡树结构及双向链表优化,实现高效磁盘I/O和范围查询,助你掌握工业级检索系统设计核心。
免费试用