阿里云Milvus产品发布:AI时代云原生专业向量检索引擎

本文涉及的产品
实时数仓Hologres,5000CU*H 100GB 3个月
实时计算 Flink 版,5000CU*H 3个月
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
简介: 随着大模型和生成式AI的兴起,非结构化数据市场迅速增长,预计2027年占比将达到86.8%。Milvus作为开源向量检索引擎,具备极速检索、云原生弹性及社区支持等优势,成为全球最受欢迎的向量数据库之一。阿里云推出的全托管Milvus产品,优化性能3-10倍,提供企业级功能如Serverless服务、分钟级开通、高可用性和成本降低30%,助力企业在电商、广告推荐、自动驾驶等场景下加速AI应用构建,显著提升业务价值和稳定性。

AI时代原生专业向量检索引擎的背景是随着大模型和生成式AI时代的到来,非理化数据在市场上迎来急速的爆发且增速明显。


ABC市场调研报告表明,在2027年非流化数据的市场占比将达到86.8%,而业界处理非对话数据通常会先进行inviting的向量化,随后分析和处理向量背后的关键技术即相似性检索以及聚类分析。

项目量数据库可以提供完整的存储,因此检索的能力是处理非流化数据最佳的选择。

 

一、向量检索服务Milvus版云原生技术架构

在众多的开源向量数据过程中,Milvus具有极速的特点即具备极高的检索的效率,能够毫秒级的检索万亿规模的向量数据,它也具备云原生的高度弹性和可扩展的能力;Milvus面向云架构设计;Milvus的功能强大,具备混合和范围和多维检索的能力;版本发布十分迅速;背后有活跃的社区的支持,在开源的github上,短短三年多时间已经有近3万的数量。以上几点关键特性,支持Milvus成为全球最受欢迎的向量客户数据库之一。


Milvus有多种应用场景,包括动态检索、广告推荐、自动驾驶、瑞格检索以及向量增强生成。Milvus是与AI结合向量检索引擎,可以赋能支撑企业完成加速AI应用的构建,在多模态场景下可以针对向量化的图片、视频、声纹等等多种数据类型进行解锁。在广告和推荐场景下,基于向量的标签能够提升更精准、相似度更高的结果。在自动驾驶中,向量解锁能力也是核心服务。


然而客户在集群运维上存在极大的挑战。首先缺乏云上资源的支持以及快速弹性伸缩的能力,导致没有办法及时应对业务的波峰和波谷。其次内核和技术度依赖于社区的支持,运维的压力和成本较高。最后缺少云上的AI生态平滑的集成,这也是自建向量数据库普遍面临的现状和问题。基于以上几点,阿里云全托管版本的 Milvus产品应运而生。


云上托管 Milvus产品提供的能力包括高性能的企业级引擎。相比于开源版本进行功能和性能的优化,包括serverless化的权重服务,能够将所有的运维动作进行白屏化。借助云弹性和调度能力以及内核性能的提升,成本相比于自建降低30%。 Milvus和阿里云上许多AI产品进行交互,在产品上进行无缝集成,大幅的提升易用性。阿里云Milvus让用户专注在业务价值,而无需为基础向量的运维和稳定性担忧。


产品在年底进行内测,并在今年4月份进行产品公测。在8个多月内,累计开通的计算CEO总数规模达上万赫。CEO即compute unit计算单元,是一core和GB的memory,集群的开通数量达千台以上。参与测试的企业多达600多家,对线上服务的稳定性进行完整和充分的打磨。因此涵盖客户应用场景十分广泛,包括电商应用的多模态检索、互联网酒店搜索以及多样化AI企业场景。绝大部分客户在测试之后选择使用阿里云支持生产业务。因此经历一系列产品核心能力打磨和功能的标准化的阿里云能够为客户提供服务的sla等级达到99.9%以上。


产品提供企业级的向上结算内核,相比于开源版本有3~10倍的性能的提升,并且100%兼容开源。其次solace平台提供分钟级开通以及托管和开箱即用就无需再对进行运维。之后就是云原生的环境提供弹性过从容、高考用和容灾的能力,通过以上的能力,可以帮助客户进行有效的TCL的降低。


阿里云联合集成云服务的上下游链路,在生态上继续与平台通义等AI产品矩阵进行集成,促进企业AI场景的落地。涉及的模型包括model selling、model training、摩搭,提供更快捷产品体验。

 

二、阿里云向量引擎快速搭建企业级RAG最佳实践

技术架构在管控平台提供管理,包括指标监控、弹性扩缩、诊断分析以及版本升级。一系列管控能力帮助客户简化运维操作。在组件层面对元数据的etc和实时数据流量进行中心化托管和混合部署。在worker层面查询数据节点和索引节点进行隔离以及扩缩容。在引擎层面,基于企业级的向量引擎提供强劲的内核支撑。在资源层面基于pix统一资源池灵活扩展提供原生安全隔离环境。


基于阿里云的对象存储提供非结构化数据的数据,针对变速箱的读写和流量进行监控和观测,能够及时发现限流问题并提升带宽。


在企业性能方面,进行阿里Milvus和社区版本的性能对比。与qps、内存以及时延关键维度的指标相比,总体性能相比于开源平均提升3~10倍,依靠大量的工程和算法优化,包括自适应索引能力auto index,自动选择适合于数据集的索引和搜索的策略。


对于开发者而言不需要关心所有参数,只需提供更好的性能和检索质量。Milvus进行特有检测能力的优化,包括对通用型性能优化以及过滤检索和二进制数据结构类型的优化。


针对检索能力优化进一步进行Mark,结果表明在通用性能型场景下提升3~10倍。容量型优化节省客户20%~40的优内存和50%的磁盘,对于其他的场景性能平均提升百分之2~4倍。


基于财运伸缩以及存储和平台调度能力进行极致的降本,根据业务特点,例如预测双十一大促对在线业务提前对资源进行扩容、针对实际场景进行弹性的设置、查询负载的高峰期、对查询进行扩充。通过三个标杆客户的实测对比,开源的资源成本降低30%以上。基于平台的service底座大幅提升稳定性和可观性。


首先solid提供基于统一坚持的分钟级别的实力的构建,第二云原生环境提供多租硬隔离和安全能力,第三架构提供高可用多副本以及稳定性保障,并且屏蔽底层资源异构机型的支持,第四点稳定保证对实力的监控和主动运维。基于以上平台和引擎能力,为企业客户提供多种适用于AI研发的流程的支持。


企业典型的开发流程包括技术方案的选型、小规模的poc以及到生产环境部署。为广大客户提供前期免费的测试以及生产转正,在产品上提供入门版的standalone的部署形态和快速进行pos的验证,以及标准版的集训分布式。


针对不同客户的业务场景提供多种规格。对于性能型针对低时延和高吞吐的场景进行设计。对于容量型是处理大量数据场景的支持,除此之外在硬件层面上支持包括叉86和APP的架构。对于CPU的支持和阿里云上的各大AI平台进行横向的集成,提供各类AI的解决方案,包括派es包括通义模搭、太原lung,Luncheon和拉曼index,降低用户的集成成本。

 

三、基于阿里云Milvus与PAI-EAS快速搭建RAG应用

基于阿里的Milvus和PAI-EAS进行快速搭建rag的应用结合云上service托管版,即使是小白用户,也可以在几分钟之内快速搭建起一套reg应用。


典型的web的应用流程在离线过程可以把知识库进行分片trunk,通过引发类模型进行文本向量化存到Milvus,在在线过程中用户对提问内容可以进行现代化,同时利用混合查询和重排序的能力,找到相似性检索top的提问内容,重新构建最终prompt。最终的大模型会更精准的输入回答,避免常见的幻觉问题。


第二个案例是具体客户的落地,阿里云Milvus成功助力识货APP的电商搭建。客户的最大特点是引导占成交占比超50%,是占内最重要的功能之一。因此客户有三个典型的需求,期望通过引入高性能的向量搜索,提高点击率和引导的交易转化率。第二是支撑电商场景下的图片文本,非流量数据的相似性检索在生产在线业务对KPI要求非常高,第三自见运维的成本高、稳定性较差,因此希望客户的业务可以稳定可靠。在和识货的技术团队进行多次配合,为客户提供支持。在一级别的数据准确性可以支持毫秒级别的查询,同规格的qps对比提升10%。提供开箱即用的全款服务,极大的缓解运维人员的精力和负担。

 

相关文章
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。
82 16
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
|
14天前
|
人工智能 自然语言处理 测试技术
阿里云通义实验室自然语言处理方向负责人黄非:通义灵码2.0,迈入 Agentic AI
在通义灵码 2.0 发布会上,阿里云通义实验室自然语言处理方向负责人黄非分享了代码大模型的演进。过去一年来,随着大模型技术的发展,特别是智能体技术的深入应用,通义灵码也在智能体的基础上研发了针对于整个软件研发流程的不同任务的智能体,这里既包括单智能体,也包括多智能体合并框架,在这样的基础上我们研发了通义灵码2.0。
104 21
|
5天前
|
机器学习/深度学习 人工智能 弹性计算
阿里云AI服务器价格表_GPU服务器租赁费用_AI人工智能高性能计算推理
阿里云AI服务器提供多种配置,包括CPU+GPU、FPGA等,适用于人工智能、机器学习和深度学习等计算密集型任务。本文整理了阿里云GPU服务器的优惠价格,涵盖NVIDIA A10、V100、T4等型号,提供1个月、1年和1小时的收费明细。具体规格如A10卡GN7i、V100-16G卡GN6v等,适用于不同业务场景,详情见官方页面。
50 11
|
7天前
|
SQL 人工智能 关系型数据库
【PG锦囊】阿里云 RDS PostgreSQL 版插件—AI 插件(rds_ai)
本文介绍了AI 插件(rds_ai)的核心优势、适用场景等,帮助您更好地了解 rds_ai 插件。想了解更多 RDS 插件信息和讨论交流,欢迎加入 RDS PG 插件用户专项服务群(103525002795)
|
14天前
|
存储 弹性计算 运维
阿里云云原生NDR发布:全流量防御能力升级
阿里云发布云原生NDR,提供全流量威胁检测与响应能力。该产品无需部署,支持一键接入、自动留存攻击报文,并具备多引擎关联分析、资产风险管理等功能,有效提升高级威胁应对能力。典型客户案例显示,NDR在重保防护、敏感数据泄露和日志合规等场景中表现出色。总结来看,NDR强调原生化、性价比和强检测,帮助用户简化安全运营并降低成本。
37 11
|
14天前
|
运维 关系型数据库 分布式数据库
阿里云PolarDB:引领云原生数据库创新发展
阿里云PolarDB引领云原生数据库创新,2024云栖大会将分享其最新发展及在游戏行业的应用。PolarDB凭借弹性、高可用性、多写技术等优势,支持全球80多个站点,服务1万多家企业。特别是针对游戏行业,PolarDB助力Funplus等公司实现高效运维、成本优化和业务扩展。通过云原生能力,PolarDB推动游戏业务的全球化部署与快速响应,提升用户体验并保障数据安全。未来,PolarDB将继续探索AI、多云管理等前沿技术,为用户提供更智能的数据基础设施。
|
15天前
|
人工智能 Java API
阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手
本次分享的主题是阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手,由阿里云两位工程师分享。
阿里云工程师跟通义灵码结伴编程, 用Spring AI Alibaba来开发 AI 答疑助手
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI任务调度
PAI平台参加“周二开源日”活动,本期分享核心内容摘要 一、AI任务的需求与DLC 二、KubeDL 三、KubeDLPro 四、总结
1710 0
云原生场景中的 AI任务调度
|
机器学习/深度学习 人工智能 Cloud Native
云原生场景中的 AI 任务调度|学习笔记
快速学习云原生场景中的 AI 任务调度。
917 0
云原生场景中的 AI 任务调度|学习笔记
|
16天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。

热门文章

最新文章