搜索推荐的搜索结果_文章_第17页-阿里云开发者社区

霖玉

|

7天前

|

博文

18 | 搜索引擎：输入搜索词以后，搜索引擎是怎么工作的？

本文介绍了搜索引擎的核心架构与工作原理，重点解析了爬虫、索引和检索三大系统。通过分词、纠错、推荐和位置索引等技术，搜索引擎能精准理解用户意图并高效召回结果，是文本检索领域的关键技术参考。

# 机器学习/深度学习 # 数据采集 # 自然语言处理 # 搜索推荐 # 索引

霖玉

|

7天前

|

博文

20 | 推荐引擎：没有搜索词，「头条」怎么找到你感兴趣的文章？

本文深入解析了资讯类App推荐引擎的检索技术。通过“下拉刷新”背后的个性化召回机制，介绍了推荐系统如何在无搜索词情况下，基于用户行为数据构建用户与文章画像，并运用基于内容和协同过滤（用户/物品）的召回算法实现精准推荐，最后通过多路混合与分层排序优化性能。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据库 # 索引

霖玉

|

7天前

|

博文

11｜精准 Top K 检索：搜索结果是怎么进行打分排序的？

搜索引擎排序直接影响用户体验，核心是Top K检索。本文详解三种打分算法：经典TF-IDF衡量词频与区分度；BM25优化词频饱和与文档长度影响；机器学习融合多因子自动调权。最后用堆排序提升Top K效率，实现高效精准排序。

# 机器学习/深度学习 # 算法 # 搜索推荐 # UED

霖玉

|

7天前

|

博文

09 | 索引更新：刚发布的文章就能被搜到，这是怎么做到的？

本文介绍了工业界倒排索引的高效更新机制。针对小规模内存索引，采用Double Buffer实现无锁读写；对于大规模数据，则使用“全量+增量”索引结合方案，并通过删除列表处理删改。为避免频繁重建开销，提出滚动合并法，逐层整合天级、周级至全量索引，兼顾性能与资源。核心思想是读写分离，提升系统并发与稳定性。（238字）

# 存储 # 自然语言处理 # 搜索推荐 # Java # 索引

霖玉

|

7天前

|

博文

19 | 广告系统：广告引擎如何做到在 0.1s 内返回广告信息？

广告系统是互联网核心营收支柱，支撑Google、Facebook等巨头超80%收入。本文解析其高性能架构：通过标签与向量检索结合、树形分片、倒排索引及非精准打分预筛，实现每秒百万级请求下0.1秒内精准响应，揭秘高并发低延迟背后的工程智慧。

# 机器学习/深度学习 # 搜索推荐 # 算法 # 数据挖掘 # 索引

霖玉

|

7天前

|

博文

12 | 非精准 Top K 检索：如何给检索结果的排序过程装上加速器？

本文介绍了非精准 Top K 检索的优化思路及三种实现方法：基于静态质量得分排序截断、胜者表利用词频打分、分层索引两阶段检索。核心思想是将复杂计算前置到离线阶段，在线时快速截断，降低打分开销。该方法广泛应用于搜索与推荐系统，通过召回+排序两阶段架构，在保证结果质量的前提下显著提升检索效率。

# 机器学习/深度学习 # 搜索推荐 # 算法 # C++ # 索引

霖玉

|

7天前

|

博文

结束语

从数组链表到搜索引擎、推荐系统，信息技术不断演进。信息爆炸时代，唯有构建思维的“检索引擎”，筛选、提炼有价值的知识，才能不被洪流淹没。学会迭代认知，打好基础，步步为营，方能跟上时代，迈向更高台阶。（238字）

# 机器学习/深度学习 # 人工智能 # 搜索推荐 # 大数据 # 5G

霖玉

|

7天前

|

博文

10 | 索引拆分：大规模检索系统如何使用分布式技术加速检索？

在大规模检索系统中，分布式技术通过拆分倒排索引提升性能。基于文档的水平拆分将数据随机分片，各服务器并行处理，缩短单次查询时间，且易于扩展与维护；而基于关键词的垂直拆分虽减少请求复制，但易引发负载不均与运维复杂。工业界更倾向文档拆分，因其具备良好均衡性、可扩展性，支持高效检索与平滑扩容，是主流实践方案。（238字）

# 自然语言处理 # 运维 # 负载均衡 # 搜索推荐 # 索引

霖玉

|

7天前

|

博文

14 | 空间检索（下）：「查找最近的加油站」和「查找附近的人」有何不同？

本文探讨了在动态查询范围内高效检索“最近的k个目标”的方案。针对GeoHash编码的局限性，提出利用四叉树和前缀树等树形结构，实现空间的层次化划分与快速范围扩展。通过非满四叉树优化存储，避免稀疏数据下的空间浪费，并以前缀树支持GeoHash字符串的高效索引。最终实现了查询范围动态调整时的高性能检索，适用于加油站、医院等“最近”需求场景。

# 存储 # 搜索推荐 # 定位技术 # 索引

霖玉

|

7天前

|

博文

05 | 倒排索引：如何从海量数据中查询同时带有「极」和「客」的唐诗？

本文通过唐诗检索的类比，深入浅出地讲解了正排索引与倒排索引的原理与应用。正排索引以文档ID为键，适合精确查找；而倒排索引以关键词为键，指向包含该词的文档列表，极大提升了关键词搜索效率。文章详细介绍了倒排索引的构建过程：文档编号、关键词解析、哈希表插入，并解释了如何通过归并有序链表实现多关键词联合查询（如交集、并集）。此外，还探讨了作者维度的扩展索引、敏感词检测的实现难点及大规模索引的存储优化方案，如压缩、磁盘索引和分布式分片。倒排索引虽原理简单，却是搜索引擎、数据库全文检索等系统的核心技术基础。

# 存储 # 自然语言处理 # 搜索推荐 # 数据库 # 索引

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

搜索推荐