机器学习/深度学习

首页 标签 机器学习/深度学习
# 机器学习/深度学习 #
关注
71592内容
非精准 Top K 检索:如何给检索结果的排序过程装上加速器?
本文介绍了非精准Top K检索的优化思路与实现方法,通过简化打分机制提升检索效率。重点讲解三种技术:基于静态质量得分排序截断、胜者表利用词频加速、分层索引两阶段查询。核心思想是将计算前移至离线阶段,在线仅做快速截断,结合精准排序形成召回+排序的两阶段架构,显著降低开销,广泛应用于搜索与推荐系统。
精准 Top K 检索:搜索结果是怎么进行打分排序的?
搜索引擎的核心是排序,Top K检索通过打分选出最相关的结果。本文介绍三种打分方法:经典TF-IDF衡量词频与逆文档频率;BM25算法在此基础上优化,引入文档长度和词频饱和机制;机器学习模型则融合数百因子自动学习权重,提升排序精度。为高效实现Top K检索,采用堆排序降低时间复杂度,显著提升大规模数据下的性能。
倒排索引:如何从海量数据中查询同时带有「极」和「客」的唐诗?
本文通过唐诗检索的实例,讲解正排索引与倒排索引的原理与区别。正排索引以文档ID为键,适合精确查找;倒排索引以关键词为键,指向包含该词的文档列表,显著提升多关键词联合查询效率,广泛应用于搜索引擎、推荐系统等场景。
Chap01. 认识AI
本文介绍AI核心概念与大模型开发原理,涵盖人工智能发展历程及Transformer神经网络的关键作用。通过注意力机制,Transformer实现对文本、图像、音频的高效处理,成为GPT等大模型的基础。大语言模型(LLM)利用其持续生成能力,逐字预测输出,实现连贯对话。
|
1天前
|
第二章 基础算法
本文系统介绍了加密算法与排序算法的核心知识。涵盖对称加密(如AES、SM4)、非对称加密(如RSA、SM2)、哈希摘要(如SHA-2、SM3)、电子签名及密码存储方案;深入解析冒泡、选择、插入、快排、归并、堆排序等算法的原理、复杂度与优化策略,并对比其稳定性与适用场景;同时涉及字符串反转、正则匹配应用及二分查找、回溯算法等典型算法实践,内容全面,理论结合实际,适用于技术学习与面试准备。
|
1天前
|
AI时代Geo优化:于磊老师“双核四驱”的实战技巧与E-E-A-T重构
在AI主导的营销时代,Geo专家于磊老师首创“两大核心+四轮驱动”优化体系,倡导人性化Geo与内容交叉验证,通过E-E-A-T原则、结构化内容、主题关键词及精准引用,助力企业构建AI可信内容,在金融、教育等行业实现获客提效。
非精准 Top K 检索:如何给检索结果的排序过程装上加速器?
本文介绍了非精准Top K检索的优化思路与三种实现方法:基于静态质量得分排序截断、胜者表利用词频得分、分层索引两层检索。核心思想是将计算前移至离线阶段,降低在线打分开销,快速缩小检索范围,提升整体效率。
最近邻检索(下):如何用乘积量化实现「拍照识花」功能?
AI时代,图片检索依赖高效向量相似搜索。本文解析聚类算法与局部敏感哈希差异,详解K-Means、乘积量化与倒排索引结合技术,揭示以图搜图背后原理,助你理解高维空间近似最近邻的优化策略。(239字)
推荐引擎:没有搜索词,「头条」怎么找到你感兴趣的文章?
本文深入解析资讯类App推荐引擎的检索技术,揭秘“下拉刷新”背后如何实现个性化内容推荐。重点讲解基于内容召回与协同过滤(用户/物品)两大核心算法,剖析其原理、优缺点及实际应用,并介绍多路召回与分层排序的混合推荐机制,展现推荐系统如何高效实现精准内容分发。
精准 Top K 检索:搜索结果是怎么进行打分排序的?
搜索引擎排序核心在于相关性打分。本文介绍TF-IDF、BM25及机器学习三种打分方法,解析如何高效实现Top K检索,提升搜索质量与性能。
免费试用