索引的搜索结果_文章_第14页-阿里云开发者社区

游客2syd4euah5df4

|

19小时前

|

博文

存储系统：从检索技术角度剖析 LevelDB 的架构设计思想

LevelDB是Google开源的高性能键值存储系统，基于LSM树优化，采用跳表、读写分离、SSTable分层与Compaction等技术，结合BloomFilter、索引分离及LRU缓存，显著提升读写与检索效率，广泛应用于工业级系统。

# 存储 # 缓存 # NoSQL # 算法 # 索引

游客2syd4euah5df4

|

19小时前

|

博文

索引更新：刚发布的文章就能被搜到，这是怎么做到的？

本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引，采用Double Buffer实现无锁读写切换；对于大规模数据，则使用“全量+增量”索引方案，结合删除列表处理删改操作，并通过完全重建、再合并或滚动合并策略优化性能，核心思想是读写分离，兼顾实时性与检索效率。（238字）

# 存储 # 自然语言处理 # 搜索推荐 # Java # 索引

游客2syd4euah5df4

|

19小时前

|

博文

索引拆分：大规模检索系统如何使用分布式技术加速检索？

在大规模检索系统中，分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片，各服务器并行处理，缩短单次查询时间，并支持灵活扩容；而基于关键词的垂直拆分虽减少请求复制，但易引发负载不均与维护难题。前者因扩展性强、运维简单成为主流方案。

# 自然语言处理 # 运维 # 负载均衡 # 搜索推荐 # 索引

游客2syd4euah5df4

|

19小时前

|

博文

最近邻检索（上）：如何用局部敏感哈希快速过滤相似文章？

在搜索引擎与推荐系统中，相似文章去重至关重要。通过向量空间模型将文档转化为高维向量，利用SimHash等局部敏感哈希技术生成紧凑指纹，结合海明距离与抽屉原理分段索引，可高效实现近似最近邻检索，在海量数据中快速识别内容相近文章，提升结果多样性与用户体验。

# 搜索推荐 # UED # 索引

游客2syd4euah5df4

|

19小时前

|

博文

数据库检索：如何使用 B+ 树对海量磁盘数据建立索引？

本讲探讨磁盘环境下大规模数据检索的挑战与解决方案。由于内存有限，数据常存储于磁盘，而磁盘随机访问远慢于内存，因此需减少磁盘IO。B+树通过将索引与数据分离、节点大小对齐磁盘块、分层存储等设计，实现高效磁盘检索。其内部节点仅存索引，叶子节点存数据，并通过链表连接，支持快速查找与范围查询。即使数据在磁盘，也能通过少量IO完成检索，广泛应用于数据库如MySQL。

# 存储 # 关系型数据库 # MySQL # 数据库 # 索引

游客2syd4euah5df4

|

19小时前

|

博文

倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的场景，对比正排索引与倒排索引的差异。正排索引以文档ID为键，适合根据标题查内容；而倒排索引以关键词为键，记录包含该词的文档列表，显著提升按内容检索的效率。文中详细讲解了倒排索引的构建过程、查询方法（如多关键字交集查询）及链表归并优化，并探讨其在搜索引擎、推荐系统等场景的应用，帮助读者掌握高效检索的核心技术。

# 存储 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # 索引

针织衫

|

19小时前

|

博文

MongoDB索引知识

MongoDB索引可大幅提升查询效率，避免全表扫描。支持单字段、复合、地理空间、文本及哈希索引，采用B-Tree结构，优化查询、排序与范围搜索。合理使用索引对性能至关重要。

# 存储 # NoSQL # 关系型数据库 # MongoDB # 索引

游客7drugl3kyg7h6

|

1天前

|

博文

推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

本文深入解析资讯类App推荐引擎的检索技术。通过“下拉刷新”无搜索词场景，探讨如何基于用户行为与内容画像实现个性化推荐。重点介绍两大核心算法：基于内容的召回与协同过滤（用户/物品维度），并讲解混合推荐与多层排序机制，揭示推荐系统如何高效实现精准内容分发。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据库 # 索引

游客7drugl3kyg7h6

|

1天前

|

博文

广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

广告系统是互联网核心营收支柱，支撑Google、Facebook等公司超80%收入。其本质是高并发、低延迟的实时检索系统，需在0.1秒内完成百万级广告匹配。本文详解广告引擎架构：通过标签过滤、树形分片优化索引；引入向量检索实现智能匹配；采用非精准打分预筛+深度学习精排的混合排序策略；并在离线索引构建时前置过滤无效广告，压缩检索空间。结合业务特点，从索引、召回到排序全方位提升性能，保障高效精准投放。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据挖掘 # 索引

游客7drugl3kyg7h6

|

1天前

|

博文

最近邻检索（下）：如何用乘积量化实现「拍照识花」功能？

AI时代，以图搜图、拍图识物广泛应用。其核心是图片特征提取与高维向量相似检索。本文解析聚类算法（如K-Means）与局部敏感哈希的区别，详解乘积量化压缩向量、倒排索引加速检索的技术原理，揭示图像检索背后的高效机制。（238字）

# 存储 # 机器学习/深度学习 # 算法 # 数据挖掘 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

索引