【2025云栖大会】阿里云助力金山办公打造智能搜索新标杆:WPS云文档搜索技术全面升级

简介: 2025年9月26日,杭州云栖大会“AI搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

演讲主题:AI 搜索年度发布——WPS 云文档搜索演进之路

随着大模型时代到来,用户需求从“关键词匹配”转向“自然语言交互与问答式搜索”。2025年9月26日,杭州云栖大会“AI搜索与向量引擎”分论坛上,金山办公云搜索技术总监——陈海荣宣布,其核心产品WPS云文档搜索功能结合阿里云搜索引擎完成重大升级,正式迈入3.0时代。

此次升级以阿里云Elasticsearch混合检索与AI语义搜索能力为核心,全面解决海量文档场景下的检索效率、语义理解与成本优化难题,为全球6.32亿月活用户提供“秒级响应、语义直达”的智能搜索体验。

关于金山办公

金山办公(Kingsoft Office)是全球领先的办公软件、服务与解决方案提供商,旗下产品包括WPS Office、金山文档等,服务全球超6.32亿月活用户,覆盖220多个国家和地区,致力于以技术创新推动办公智能化转型。

深耕技术迭代:从基础架构到语义搜索的跨越

作为拥有2625亿云文档、服务全球220余个国家和地区的企业级应用,WPS云文档搜索功能历经三次技术革新。早期版本面临“搜不到、排不准、响应慢”等挑战:1.0版本通过自研QU引擎、分词器及高亮算法,将首屏点击率从53.7%提升至69.8%,MRR(平均倒数排名)翻倍至0.52;2.0版本依托阿里云ES索引优化、跨集群网关等技术,实现查询P99延迟<350ms,集群稳定性显著提升,支撑千亿级文档规模下的高效检索。

金山办公云搜索技术总监陈海荣指出:“用户不再局限于文件名检索,而是希望输入‘项目Q3营收数据’或‘公司规章制度’等语义指令,直接获取结构化答案。”这一转变推动WPS搜索进入3.0时代。

阿里云技术赋能:混合检索与AI原生架构

在3.0版本中,金山办公联合阿里云Elasticsearch构建“语义搜索+向量检索”的混合技术架构,实现三大突破:

  1. 文档AI原生化:通过多维度AI解析引擎,对文档内容进行语义标签化处理,提升文档理解深度


  1. Query意图精准识别:基于大模型的自然语言处理能力,实现搜索意图分流,支持“全库问答”“文档关联检索”等场景;
  2. 冷热数据智能管理:依托阿里云ES冷热索引策略,将向量检索内存资源需求降低70%、CPU消耗减少50,同时通过自动化的写入/查询Pipeline,实现业务无感的高效成本控制。


以实际场景为例,用户输入“新人如何申请休假”时,系统可自动关联公司制度文档并提取关键流程;输入“项目A季度总结”时,AI直接从相关文档中抽取数据生成摘要,真正实现“告别盲找,一步直达答案”

未来展望:AI搜索生态的全球布局

金山办公与阿里云的深度合作,不仅优化了搜索技术架构,更重塑了智能办公场景的用户体验。未来,双方计划进一步融合多模态检索、实时协同搜索等能力,并拓展至企业知识库管理、跨语言文档检索等全球化场景。


“阿里云Elasticsearch的混合检索能力与技术前瞻性,是支撑WPS搜索持续领先的关键。”陈海荣表示。作为企业级搜索领域的标杆案例,WPS云文档的技术升级为行业提供了可复用的智能化升级路径——从底层架构优化到上层语义交互创新,阿里云持续以“技术+场景”双轮驱动,赋能企业构建下一代智能搜索生态。


了解更多:

阿里云 检索分析服务 Elasticsearch 官网:https://www.aliyun.com/product/bigdata/elasticsearch

阿里云 检索分析服务 ES Serverless 官网:https://www.aliyun.com/product/es/es-serverless


阿里云AI搜索团队打造大模型原生搜索,攻关分布式与实时检索,助力企业升级搜索与增长。

现招聘:

搜索引擎技术专家:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000101003&trace=qrcode_share

管控研发工程师:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2009043004&track_id=SSP1761801590532QwTKePtoFi4697

技术专家-AI搜索:https://careers.aliyun.com/off-campus/position-detail?lang=zh&positionId=2000098307&track_id=SSP1761801590532ANPPiMeSTo2156

相关文章
|
26天前
|
消息中间件 安全 NoSQL
阿里云通过中国信通院首批安全可信中间件评估
近日,由中国信通院主办的 2025(第五届)数字化转型发展大会在京举行。会上,“阿里云应用服务器软件 AliEE”、“消息队列软件 RocketMQ”、“云数据库 Tair”三款产品成功通过中国信通院“安全可信中间件”系列评估,成为首批获此认证的中间件产品。此次评估覆盖安全可信要求、功能完备性、安全防护能力、性能表现、可靠性与可维护性等核心指标,标志着阿里云中间件产品在多架构适配与安全能力上达到行业领先水平。
387 202
|
1月前
|
消息中间件 存储 Kafka
流、表与“二元性”的幻象
本文探讨流与表的“二元性”本质,指出实现该特性需具备主键、变更日志语义和物化能力。强调Kafka与Iceberg因缺乏更新语义和主键支持,无法真正实现二元性,唯有统一系统如Flink、Paimon或Fluss才能无缝融合流与表。
130 7
流、表与“二元性”的幻象
|
26天前
|
人工智能 自然语言处理 搜索推荐
阿里云 AI 搜索 DeepSearch 技术实践
阿里云OpenSearch LLM版推出DeepSearch技术,实现从RAG 1.0到RAG 2.0的升级。基于多智能体协同架构,支持复杂推理、多源检索与深度搜索,显著提升问答准确率,助力企业智能化升级。
459 23
|
1月前
|
人工智能 并行计算 算法
为什么 OpenSearch 向量检索能提速 13 倍?
本文介绍在最新的 OpenSearch 实践中,引入 GPU 并行计算能力 与 NN-Descent 索引构建算法,成功将亿级数据规模下的向量索引构建速度提升至原来的 13 倍。
603 24
为什么 OpenSearch 向量检索能提速 13 倍?
|
1月前
|
人工智能 运维 监控
【2025云栖大会】AI 搜索引擎如何驱动亿级物流:货拉拉 x 阿里云 Elasticsearch
2025云栖大会 AI搜索与向量化模型专场上,拉拉 Elasticsearch技术负责人——陈敏华先生分享了 Elasticsearch 在全球化高并发业务场景下的深度实践,以及在迁移至阿里云 Elasticsearch Serverless 后的显著收益。货拉拉的案例为业界提供了可复制、可落地的技术范本。
232 4
|
2月前
|
人工智能 自然语言处理 算法
【2025云栖大会】AI 搜索智能探索:揭秘如何让搜索“有大脑”
2025云栖大会上,阿里云高级技术专家徐光伟在云栖大会揭秘 Agentic Search 技术,涵盖低维向量模型、多模态检索、NL2SQL及DeepSearch/Research智能体系统。未来,“AI搜索已从‘信息匹配’迈向‘智能决策’,阿里云将持续通过技术创新与产品化能力,为企业构建下一代智能信息获取系统。”
380 9
|
7月前
|
数据采集 SQL canal
Amoro + Flink CDC 数据融合入湖新体验
本文总结了货拉拉高级大数据开发工程师陈政羽在Flink Forward Asia 2024上的分享,聚焦Flink CDC在货拉拉的应用与优化。内容涵盖CDC应用现状、数据入湖新体验、入湖优化及未来规划。文中详细分析了CDC在多业务场景中的实践,包括数据采集平台化、稳定性建设,以及面临的文件碎片化、Schema演进等挑战。同时介绍了基于Apache Amoro的湖仓融合架构,通过自优化服务解决小文件问题,提升数据新鲜度与读写平衡。未来将深化Paimon与Amoro的结合,打造更高效的入湖生态与自动化优化方案。
422 1
Amoro + Flink CDC 数据融合入湖新体验
|
1月前
|
存储 人工智能 Cloud Native
【2025云栖大会】AI原生搜索引擎:Elasticsearch 换“芯”
9月26日,云栖大会AI搜索与向量引擎分论坛上,阿里云智能集团技术专家 魏子珺 和爱橙科技技术专家 周文喆,详细阐释了 “AI 原生搜索引擎:Elasticsearch 换芯” 技术主题,重点围绕 AI 原生搜索内核增强技术的升级与替换。通过核心能力重构,让 Elasticsearch 在 AI 原生时代具备更强的多模态理解、自然语言处理以及深度任务执行能力,为搜索场景带来性能、智能化与可扩展性的大幅提升。
247 0
|
1月前
|
存储 人工智能 自然语言处理
阿里云 Elasticsearch 的 AI 革新:高性能、低成本、智能化的搜索新纪元
本文介绍了数智化浪潮下, 阿里云 Elasticsearch 打通了 云原生内核优化、RAG 闭环方案、云原生推理平台 三大能力模块,实现了从底层到应用的全链路升级,助力企业构建面向未来的智能搜索中枢。
367 22