索引

首页 标签 索引
# 索引 #
关注
66546内容
10 | 索引拆分:大规模检索系统如何使用分布式技术加速检索?
在大规模检索系统中,分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片,各服务器并行处理,降低单次查询耗时,且易于扩展与维护;而基于关键词的垂直拆分虽减少请求复制,但易引发负载不均与运维复杂。工业界普遍采用文档拆分,兼顾效率与可维护性。
14 | 空间检索(下):「查找最近的加油站」和「查找附近的人」有何不同?
本文探讨了动态范围内“查找最近的k个目标”问题,如导航找加油站。针对查询范围不固定场景,提出利用四叉树、非满四叉树和前缀树优化检索效率与存储空间。通过树形结构实现快速范围扩展,避免重复查询,提升性能。
19 | 广告系统:广告引擎如何做到在 0.1s 内返回广告信息?
广告系统是互联网核心营收支柱,支撑Google、Facebook等巨头超80%收入。本文详解其高性能引擎架构:通过标签过滤、树形分片、向量检索与非精准打分等技术,在0.1秒内完成百万级广告实时召回与排序,实现千人千面精准投放。
15 | 最近邻检索(上):如何用局部敏感哈希快速过滤相似文章?
在搜索引擎与推荐系统中,相似文章去重至关重要。通过向量空间模型将文档转为高维向量,利用SimHash等局部敏感哈希技术生成紧凑指纹,结合海明距离与抽屉原理分段索引,可高效近似检索相似内容,避免重复展示,提升用户体验。该方法广泛应用于网页去重、图像识别等领域。
16 | 最近邻检索(下):如何用乘积量化实现「拍照识花」功能?
随着AI发展,以图搜图、拍图识物等应用日益普及,其核心是高效图片检索技术。本文深入解析如何通过聚类算法(如K-Means)与乘积量化结合倒排索引,实现高维图像特征向量的快速近似最近邻搜索,在降低存储开销的同时提升检索效率,广泛应用于图像搜索、推荐系统等领域。
|
5天前
|
局域网电脑管理中的JavaScript哈希表算法实践
本文探讨哈希表在局域网电脑管理中的应用,基于JavaScript与Node.js实现高效设备信息存储与查询。通过MAC地址哈希映射,支持快速增删改查与动态扩容,显著提升大规模设备管理性能,附可运行代码示例。
环形数组技巧
环形数组通过模运算在逻辑上将线性数组首尾相连,利用start和end指针实现头部O(1)增删。虽物理上非环形,但通过取余操作让指针循环移动,结合左闭右开区间设计,高效支持动态扩容缩容,适用于双端队列等场景。
队列/栈基本原理
本文介绍栈和队列的基本原理。二者均为操作受限的数据结构:队列仅能在队尾入队、队头出队,遵循“先进先出”(FIFO);栈则只允许在栈顶进行插入和删除,遵循“先进后出”(FILO)。底层多用数组或链表实现。
单/双链表代码实现
本文详解双链表与单链表的自定义实现,重点讲解三个核心技巧:同时持有头尾节点引用以优化操作效率、使用虚拟头尾节点简化边界处理、避免内存泄漏的良好编程习惯。代码涵盖增删查改基本操作,适合掌握链表原理后深入学习实际开发中的链表应用。
用拉链法实现哈希表
本文详解哈希表中拉链法的实现原理,通过简化版与完整版Java代码,介绍如何用链表解决哈希冲突,支持泛型、动态扩容及增删查改操作,帮助深入理解哈希表底层机制。
免费试用