【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”

简介: 2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”

演讲主题:AI 搜索智能探索——基于AI搜索开放平台的Agentic Search算法技术揭秘

在全球AI技术快速迭代的背景下,信息检索与搜索技术正迎来革命性突破。

9月26日,云栖大会AI搜索与向量引擎分论坛上,阿里云智能集团高级技术专家——徐光伟深度解析了基于AI搜索开放平台的Agentic Search算法技术体系,并结合技术架构演进与商业化实践,展示了阿里云在向量模型优化、多模态检索、DeepSearch/DeepResearch等领域的创新成果。

AI搜索趋势的演进:从静态检索到动态智能

徐光伟指出,AI搜索技术经历了三个关键阶段:传统智能搜索(全网/垂类/云端搜索)——RAG 增强搜索(结合大模型生成能力)——快速发展的 Agentic Search(代理式动态搜索)。

Agentic Search 通过大模型自主决策“何时、何地、如何”执行搜索任务,可完成复杂任务规划等操作。徐光伟强调,阿里云AI搜索开放平台实现了三阶段技术的融合,在保留传统搜索高效性的同时,通过大模型赋能动态任务执行,为客户提供全栈式解决方案。

技术亮点一:低维高效向量模型,平衡性能与成本

针对向量检索中高维度带来的存储与计算压力,阿里云实现套娃 Adaptor 技术,通过在 Embedding 模型后添加轻量级 MLP 映射层,在无监督场景下将向量维度压缩至 512 维的同时保持近似完整向量的精度。

实测数据显示,在存在有监督数据时该技术在客户场景中实现 Recall@1指标提升超 10 个百分点。目前,向量降维服务与定制化模型训练能力已集成至 OpenSearch 产品,支持企业按需调用。

技术亮点二:多模态检索能力升级,覆盖多样化场景

面对图片、视频等非结构化数据的快速增长,阿里云自研并开源 Ops-MM-embedding 模型,在 MMEB 榜单中达到开源模型领先水平。

该模型通过三阶段训练(跨模态对齐、难负样本挖掘、领域数据微调)及 Ensemble 优化,显著提升文本-图像/视频的跨模态检索精度。

  • 例如:
  • 电商图搜:支持多主体识别,可在一张图片中定位多个商品并精准匹配相似结果。
  • 视频检索:支持长视频关键时刻的精准定位,实现秒级直达用户所需内容。


多模态检索技术已经在多个领域展现出巨大价值。在零售电商中,通过图像理解与多主体识别,用户可以“以图找货”,快速匹配相似商品;在视频处理场景中,可以通过语义检索精准定位到视频中的目标画面,实现秒级直达。

结合 OpenSearch 提供的电商图搜与视频精准定位能力,企业可实现商品拍摄搜、视频关键帧索引等场景应用。这类应用不仅大幅提升了检索的准确性与响应速度,还带来更直观、高效的交互体验,为电商推荐、体育赛事分析、影视版权管理等提供了强大动力支撑。

技术亮点三:NL2SQL技术突破,提升自然语言查询能力

在自然语言搜索领域,阿里云 OpenSearch-SQL 为用户带来了“所问即所得”的交互体验。

阿里云 OpenSearch-SQL 技术通过四模块协同架构(预处理、信息抽取、生成、优化)及多轮一致性对齐策略,有效缓解传统 NL2SQL 中的模型幻觉问题。该方案在公开 BIRD 榜单中取得领先成绩,并已应用于金融、政务等领域数据库查询场景。相关论文被 SIGMOD 会议收录,核心代码同步开源。

阿里云 OpenSearch-SQL 为企业数据库检索、业务分析、即席查询等场景提供了高效、易用、低门槛的解决方案,让非技术用户也能直接从自然语言获取精准数据洞察。

技术亮点四:DeepSearch与DeepResearch,复杂任务处理的智能体系统

针对深度搜索与科研级复杂需求,阿里云构建了 Agentic Search 智能体系统,其核心技术亮点包括:

  1. 动态规划与多工具协同:通过 Retrieval Router、Retrieval Agents 及 MCP工具链,实现任务分解、多轮工具调用与结果修正;
  2. 多层级 Memory 系统:引入 Memory LLM 插件,在客户数据上微调小型模型,辅助大模型理解垂直场景,复杂问题解决率提升33%;
  3. 全流程自动化:从背景调查、任务规划到报告生成,系统支持动态迭代与纠错,已在科研文献分析、金融尽调等场景落地。

这些能力让 AI 搜索不仅能“找答案”,还能“做研究”,真正执行从信息收集、加工到输出的一条龙任务。


在 Deep Search/Research 的执行过程中,阿里云将任务处理拆分为 背景调查—规划执行—报告生成 三个阶段。这一流程确保了从用户提问到成果产出的全过程可控、精确与高效,特别适合多步推理和复杂研究类任务。具体流程图如下:


在权威基准评测中,阿里云 Deep Search/Research 展现了强大的跨任务适应性和复杂问题处理能力。无论是在多轮深度检索任务(BrowseComp)、多跳推理任务(HotpotQA),还是综合搜索评估(Xbench-DeepSearch)中,该方案都稳居行业前列,并较传统单步 RAG 模式实现大幅性能提升。这证明了其在任务分解、多工具协作、记忆驱动推理等创新机制上的显著优势,为科研分析、竞争情报、深度数据研究等高难度应用场景提供了更高准确率与更稳健的解决方案。

在实际应用中,阿里云 Deep Search/Research 不仅能完成多步信息检索与深度分析,还能将推理链路全过程透明化展示,并生成结构化、多格式的成果报告。从推理步骤和工具调用,到 Markdown 文本和可视化图表,再到网页端交付,整个过程实现了 从任务分解 → 数据分析 → 多端成果交付 的闭环。

这种全链路能力,使其在商业调研、市场分析、科研报告等场景中,既保证了分析过程的可追溯性,又提升了结论呈现的专业度与可用性。

技术驱动场景:全栈能力助力行业智能化升级

阿里云搜索技术体系的核心价值在于技术深度与场景广度的结合:

  1. 生态共建:持续在 HuggingFace、GitHub 等平台输出 Ops-MM-embedding 模型、OpenSearch-SQL工具链等核心能力;
  2. 产品化能力:OpenSearch 平台集成向量检索、多模态搜索、智能推荐等全栈功能,服务超10万企业客户,日均处理搜索请求超50亿次;
  3. 行业赋能:未来将进一步深化大模型与搜索技术的融合,助力医疗、法律、智能制造等领域实现智能化升级。

结尾

“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”

阿里云 AI 搜索的演进,展示了搜索领域从关键词匹配 → 语义理解 → 多模态融合 → 多 Agent 协作研究的技术飞跃。

无论是精准的电商图搜、智能化的视频搜索、多源异构的数据整合,还是深度多步的分析研究,Agentic Search 都能为用户带来更高效、更智能、更贴合需求的结果。面向未来,AI 搜索是企业和个人应对信息洪流的智能导航仪,也即将进入真正的、智慧搜索时代。


了解更多:


阿里云 AI 搜索开放平台 官网:https://www.aliyun.com/activity/bigdata/opensearch/platform

阿里云 智能开放搜索 OpenSearch 官网:https://www.aliyun.com/product/opensearch

相关文章
|
人工智能 自然语言处理 Devops
云效 AI 智能代码评审体验指南
云效AI智能代码评审正式上线!在合并请求时自动分析代码,精准识别问题,提升交付效率与质量。支持自定义规则、多语言评审,助力研发效能升级。立即体验AI驱动的代码评审革新,让AI成为你的代码质量伙伴!
307 7
|
2月前
|
机器学习/深度学习 人工智能 算法
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
本数据集包含2500张已标注实验室设备图片,涵盖空调、灭火器、显示器等10类常见设备,适用于YOLO等目标检测模型训练。数据多样、标注规范,支持智能巡检、设备管理与科研教学,助力AI赋能智慧实验室建设。
用于实验室智能识别的目标检测数据集(2500张图片已划分、已标注) | AI训练适用于目标检测任务
|
2月前
|
传感器 人工智能 数据安全/隐私保护
学生不应依赖AI写作业,怕大脑用进废退。职场人呢?
过度依赖AI将削弱深度思考能力,创新源于主动“跨界整合”。职场人需警惕“思维外包”,善用AI为“杠杆”而非“拐杖”,保持自主思考方能突破边界。法思诺创新学院倡导:创新可训练,大脑越用越强。
117 2
|
2月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
535 33
|
2月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
454 30
|
3月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
903 45
|
2月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
394 1
|
2月前
|
消息中间件 人工智能 安全
构建企业级 AI 应用:为什么我们需要 AI 中间件?
阿里云发布AI中间件,涵盖AgentScope-Java、AI MQ、Higress、Nacos及可观测体系,全面开源核心技术,助力企业构建分布式多Agent架构,推动AI原生应用规模化落地。
275 0
构建企业级 AI 应用:为什么我们需要 AI 中间件?
|
2月前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。