云端问道10期方案教学

本文涉及的产品
阿里云百炼推荐规格 ADB PostgreSQL,4核16GB 100GB 1个月
云原生数据仓库AnalyticDB MySQL版,基础版 8ACU 100GB 1个月
数据安全中心,免费版
简介: 本次分享由阿里云产品经理陈茏久主讲,主题为“通义百炼融合AnalyticDB,10分钟创建网站AI助手”。内容涵盖五大章节:大模型带来的行业变革、向量数据库驱动RAG服务化的探索、方案及优势、典型场景应用案例、方案涉及产品的选型配置简介和最新发布。介绍了大模型在电商、教育、汽车、游戏等行业的应用,以及AnalyticDB在向量数据库和RAG服务中的优势和具体案例。最后预告了ADB即将发布的功能,包括支持通义灵码企业标准版问答和成为析言推荐的NISQL数据分析引擎。

内容介绍:

一、大模型带来的行业变革

二、向量数据库驱动RAG服务化的探索

三、方案及优势、典型场景应用案例

四、方案涉及产品的选型配置简介

五、最新发布

 

本次分享的主题是通义百炼融合AnalyticDB,10分钟创建网站AI助手,由阿里云产品经理陈茏久(茏城)分享。

image.png

本课程主要介绍在方案中重要的技术背景、行业情况,帮助大家更好的了解这款解决方案。

 

image.png

 

本内容共涵盖五个章节:

1、介绍当前大模型带来的行业变革,以及在数据结合大模型的情况下对于数据的新要求。

2、AnalyticDB在向量数据库驱动RAG服务化的相关探索。

3、介绍AnalyticDB和阿里云百炼结合相较于整个行业的优势,以及目前行业里玩家的典型场景和应用案例。

4、介绍本次配套方案涉及相关产品的选型和产品能力介绍。

5、预告在这个领域的最新发布,介绍在哪些方面会带来全新体验

 

一、大模型带来的行业变革

image.png

随着模型的发展趋势,各行各业正在以不同的速率拥抱大模型。


第一,拥抱最快的是电商游戏和广告这类互联网公司,在场景和人力成本上有极大的依托,可通过大模型进行提效。比如电商场景里售前售后将企业自身产品的相关知识结合大模型,实现用户支持的提效,通过交互方式帮助客户有更好的导购体验、售中知识体验、售后客服体验。对游戏广告这类生成类目,可在游戏NPC体验上升级,同时对于新游戏的发布、游戏中相关的服务器维护、客服高发场景上通过大模型的方式进行更好的资源支撑,实现效率最优。


第二,教育、媒体、影视这类有海量知识内容沉淀的企业可以快速拥抱大模型,以提升原来需要大量人力成本服务的编辑场景。比如教育、老师客服、老师教学、学习助手支持、用户自学习的相关场景,大模型与现有的教材间可实现非常好的契合。非常多的教育行业已开始拥抱大模型,媒体、影视行业更多是将多模态与大模型融合,实现更快速媒体资源创作、寻找,最后进行行业变革。


第三,一些重度和安全相关的企业和传统企业也在积极的寻找和大模型领域的相关结合。


综上,有以下的行业趋势:


首先,于数据,将原来单纯的结构化数据即可驱动业务变成需要更大范围、更多模态的数据支持在线业务,比如客服、销售,数据规模正在大幅增长。同时大模型创造的数据存储的规模也影响数据存储的覆盖范围,这是正向的飞轮的正在形成。


第二,对于数据质量的要求正在提升。数据的质量决定了大模型的回答、应用的质量,更好的数据质量、数据规范,更合理的数据建模,帮助一些企业能更快的拥抱大模型并形成极好的效果。


在增长的同时,更多的企业开始关注数据安全,对于整个企业核心资产的数据,如何保证数据安全的情况下使用大模型是企业非常关注的。需要在高度数据安全的环境下,有效使用大模型进行能力升级,是全域企业所需要的能力。现在全行业正在积极的拥抱AI、构建企业孪生应用。


 

二、向量数据库驱动RAG服务化的探索

image.png

为满足以上需求,AnalyticDB进行了一些相关的行业探索。首先将企业的大模型服务进行能力分层,自上而下分别是企业私有的服务,包括企业自身的知识库(企业核心的知识资产),企业希望通过大模型以全新的方式进行知识的传递服务、传递效率,同时提升产品体验。对于有较明确的私域化场景、独特性场景的企业,需要提供自己的模型,进行模型的finetune。在模型服务侧,以阿里云为例,通义模型提供基本的LM大语言基础模型。与此同时,各行业有自己的行业知识、行业壁垒。为更好满足各行业和模型的适配,很多企业包括独立服务商或阿里云厂商都在各行业提供了专有的行业模型,以满足该行业特有的相关场景。真正的企业落地是将企业内部的服务与模型厂商的服务进行结合。比如RAG就是将知识库与下面模型服务商提供的模型进行在框架下的结合,完成企业相关的落地。

 

image.png

 

如图,这是RAG构建的体验链路。企业更关注下半部分,企业自身的知识是核心竞争力,这些知识包括之前处理的结构化文档,目前越来越多的多模态的数据比如声纹、图片、视频等也开始进入企业知识构建的范畴。将这些知识进行企业知识的规划、结构化之后,通过向量算法将其存储到企业的向量湖仓中,湖仓可用于未来持续为企业提供与大模型集成的知识的基建和检索能力。于用户,当提供交互式体验时,包括聊天历史和新问题,通过大语言模型可以将其进行长短记忆结合,形成单次独立问题。将该问题通过算法embedding,生成一段涵盖上下文语、词间语义的向量数,从而进入企业的知识库查找企业相关的知识,而这些知识则是与这个问题最相关的一些内容,将其通过多路召回全文检索、向量以及其他结构化的方式。将多路召回的结果面向语义小模型精排,可提供该企业内面向此问题最相关的知识资产,将这些资产和问题一起拼凑成面向解决用户应用场景的crowd。例如果是客服场景,那么请扮演一个客服,用以下企业的产品知识1、2、3、4、5进行回答,交替给大模型进行相关的推理求解,最终生成在场景下的答案。prompt可以基于不同的场景变化,如果是售前,可以对其进行语义语调、回答方式上的调整。这些独立、开放的prompt将面向企业提供灵活性满足不同场景下的对答体验。在大模型的加持下,原来对于结构化的数据之外需要处理海量非结构化的知识图片等多模态的数据应用到大模型中,对应用的搭建、处理数据的规模、数据检索的质量和性能提供了更高的要求。

 

image.png

 

AnalyticDB是一款高度自研的向量数据库,在数据库能力上一直处于全球领先地位,在2019年自研了整体的销量能力,也在近些年进行了高度演进。目前在满足所有数据库能力的情况下,在开源产品的向量检索、全文检索的融合查询方面较有优势。

 

image.png

 

使用这款引擎能更好的为企业提供长期核心知识构建的服务。ADB是MTP的数据库,可以随着企业数据规模不断增大、服务客户不断增多持续的延展,以线性的能力提供增量计算和存储。这样可以保证在业务持续增长、知识不断增多时,核心底层技术可以非常平滑的进行服务能力拓展。对于核心技术算法,将在每个节点上提供向量检索、全文检索、条件过滤等,一个任务分布到多个节点上进行并行计算,同时查询整个结果,唯一性与事务性均可以保证。这种方式可以满足随着业务规模的不断增大、扩展期间,能力保持一致。对于数据存储的形态,除了结构化等传统能力之外,对于向量、半结构化、非结构化的数据均提供相关存储,也保证客户可以将更多的业务场景依托引擎进行相关服务。这款引擎已服务了数百客户,也完成了从小规模到大规模的全场景客户实践。

 

image.png

 

AnalyticDB 虽然是阿里云自研产品,但和开源的合作非常紧密。已从OpenAI社区即ChatGPT Retrieval plugin到lang chain 、Llmaindex和Dify&streamlit社区。AnalyticDB DB已经全面的提交相关框架适应代码,满足这些框架中所有和RAG相关的场景化应用也会持续和开源深度合作,保证客户在未来面向开源的使用选择中不会因为ADB缺少相关支持而被迫变化架构,这也是该产品比较靠前的原因。

 

三、方案及优势、典型场景应用案例

 

1.结合阿里云以及开源相关方案和典型客户落地场景

 

image.png

(1)阿里云百炼的默认向量

阿里云最主流的产品——商业化大模型AnalyticDB和百炼一起为企业提供了非常安全的、企业级的知识库及增强检索的服务架构。在这个架构中,AnalyticDB已是阿里云百炼的默认引擎向量引擎之一,支持海量的、多租户的数据安全隔离和访问。


(2)RAG检索优化

ADB和百炼引擎在RAG检索链路上构建相关竞争优势。相较于NaiveRAG, 使用fusion、长短查询、查询改写以及自研阿里云embedding的算法,整体上做到了相较于开源算法有非常强的召回精度的提升。这也帮助企业做真正面向客户服务的时候能够提供差异化的召回精度和推理精度的提升。


(3)保障企业数据安全

ADB对于企业的数据安全做了提前考虑。今天的企业非常关注知识部分的存储和知识使用的可监管。AnalyticDB支持用户构建在自己的云上、VPC内,也就是资源是客户自己的数据库资源,可以将AnalyticDB的资源与百炼平台有限的打通,将百炼的服务能力与企业自身的数据能力进行支持。在每次RAG的查询过程中,仅返回企业认为可以透出的相关知识交予百炼,进行相关的模型推理和客户服务。这样可以最大程度监管企业内的信息流出,同时确保企业全域知识私域内的私密性。ADB在被百炼调用的过程中,可以做到所有使用量的监控、审计,同时进行相关的权限配置,确保企业可以有全局数据安全的掌控。这种合作方式影响未来选择ADB后在阿里云上其他的RAG相关应用,比如灵码、点金、钉钉、析言等,均可使用这种方式,即ADB的一次单向的选择,可以帮助客户未来在阿里云上使用RAG场景从而做到核心知识库的复用,同时也能做到选型上更长久的判断。

 

image.png

 

使用自己私域的ADP结合通义百炼构建一个面向轻量级的网站,可以做到基于企业私域知识使用的AI助手。包括在百炼构建模型应用、搭建示例网站,同时引入AI助手,第一次调用,基于纯互联网的知识会怎么回答。在增加知识库后,基于企业自身私域知识在面向网络AI助手时能得到什么样的回答。


2.汽车行业的相关支撑

 

image.png

 

车载的车机实际上承担了非常重的交互体验,在相关的支架(如出行规划)、基于互联网知识的闲聊和基于企业私域知识的闲聊、陪护、讲故事车书上均有很好的落地案例。汽车作为重销售的场景,对于销售助手企业有非常多的相关培训,包括销售培训、数字人、文案生成(金牌话术),同时包括研发效率上企业办公、企业知识的问答,这些均可通过配套解决方案全域实现。


3. 教育行业的变革

image.png

 

企业教培的客户有数万客户,数万客户内每个企业有自己的整套的权限管理和课程,以及有海量的学生。这均可通过一套ADB进行多个客户、多个组织架构、多套课程的全域教育SARS,让学生自学、查课的过程以及教育知识助手的相关过程均可通过RAG进行体验全新变更,满足对于海量客户服务过程中边际成本递减的方式。海量运用ADB多租户、数据库能力完备、支持强有力的向量检索和开源的框架打通能力。


4、游戏行业的客服

 

image.png

 

游戏行业的客服原来是基于单轮对话进行查找,现在可以基于RAG进行架构升级,通过大脑使用和游戏世界观的独立建立,做到数百款游戏同时的在线客服的服务。通过多轮对话的方式,经过安全滤网的评估策略,实现了从意图判断、知识召回、总结润色和排版优化的智能内容生成,实现游戏内、游戏外客服全链路的体验升级。

 

四、方案涉及产品的选型配置简介

 

1.方案及产品选型配置

image.png

(1)云原生数据仓库AnalyticDB PostgreSQL

云原生数据仓库AnalyticDB PostgreSQL,选用基础版的最低规格即可完成本次课程,即开启向量引擎,同时支持4C*单节点存储50G,这里可以开在北京,预估费用在三元左右。


(2)函数计算

函数计算主要用于帮助客户搭建网站,同时开放网站智能助手,提供相关的样例代码,进行快速的冷启动,完成网站和智能助手的应用层构建,本次对于新用户全免费。


(3)阿里云百炼产品

阿里云百炼产品主要用于模型调用、RAG应用的智能化应用搭建,目前新客户免费使用token。如果在1个小时内完成,体验不超过10元。


2、ADB的两种资源实力

 

image.png

 

1高性能版本,基本可以满足主流的业务使用,只需指定所有的计算资源和存储资源即可。

2对于企业未来在长期使用过程中,面向最核心、高可用的场景,推荐企业购买可用版本,相较于高性能版本上,可用性、容灾DR上有非常强的保障,也提供99.95的SRV保障,购买逻辑和高系统版本一样,目前ADB只对计算和存储进行收费。

 

五、最新发布

 

1、ADB即将发布的相关内容

image.png

 

1企业内可能会使用灵码助手,AnalyticDB PostgreSQL服务目前已经支持了通义灵码企业标准版问答,即将在Q2开放企业的私域ADB作为私域的RAG引擎关联,完成和百炼一样的框架搭建。这样,企业可将自身的知识存储在本地,将自己的私域内容作为灵码生成的补充,确保生成的代码更符合企业的标准和企业的自身代码库的积淀。


2ADB成为析言推荐的NISQL数据分析引擎。ADB实际在数仓领域也有非常多的客户进行相关选择。作为企业核心的数据分析引擎。析言可以更好的将ADB的使用方式从单纯面向分析师的SQL使用方式、面向BI对接的使用方式变成通过自然语言的交互式数据查询引擎。用户可以使用自然语言查询post在ADB上的核心数据资产,完成数据分析、数据运营等相关的工作。目前这个能力已经开放,并且ADB也会持续和阿里云主流大模型相关的应用进行整合、集成,帮助企业覆盖更多大型原生的构造场景。

相关实践学习
AnalyticDB MySQL海量数据秒级分析体验
快速上手AnalyticDB MySQL,玩转SQL开发等功能!本教程介绍如何在AnalyticDB MySQL中,一键加载内置数据集,并基于自动生成的查询脚本,运行复杂查询语句,秒级生成查询结果。
阿里云云原生数据仓库AnalyticDB MySQL版 使用教程
云原生数据仓库AnalyticDB MySQL版是一种支持高并发低延时查询的新一代云原生数据仓库,高度兼容MySQL协议以及SQL:92、SQL:99、SQL:2003标准,可以对海量数据进行即时的多维分析透视和业务探索,快速构建企业云上数据仓库。 了解产品 https://www.aliyun.com/product/ApsaraDB/ads
相关文章
|
存储 数据安全/隐私保护 开发者
开发搭建体育赛事直播平台详细的步骤和建议
开发创建体育赛事直播平台是一个备受欢迎的创业选择,尤其在体育赛事在线观看和直播技术不断提升的情况下。下面是详细的步骤和建议,以确保您的项目成功上线并满足用户需求。
|
18天前
|
弹性计算 监控 Serverless
云端问道9期方案教学
本文介绍了Serverless的发展历程及SAE(Serverless Application Engine)产品。首先,回顾了云计算从物理机、虚拟机到容器化再到Serverless的演进过程,并解释了Serverless的核心特点:无需管理底层资源、自动弹性伸缩、聚焦业务价值。接着,详细介绍了SAE的功能与优势,包括简化部署流程、支持多种弹性策略和提供丰富的运维工具。SAE的收费模式主要基于CPU和内存使用量,辅以请求数和流量计费,用户可以选择按量付费或预付费资源包。最后,通过极氪汽车、南瓜电影、视野数科和SKG等实际案例,展示了SAE在不同行业的应用效果。
47 10
|
5天前
|
存储 编解码 数据处理
云端问道第4期实践教学——多媒体数据存储与分发方案部署演示
该文档详细介绍了阿里云一键部署和手动部署多媒体数据存储与分发方案的步骤。一键部署通过资源编排服务(ROS)实现自动化,涵盖注册账号、开通服务、创建OSS Bucket、配置CDN加速及绑定IMM等功能,简化了复杂操作。手动部署则更细致地展示了每个配置环节,包括网络规划、资源创建、域名绑定、CDN配置、证书加密及最终的验证与清理,确保用户对整个流程有清晰理解。两种方式均以OSS为核心,支持数据上传、转码处理和加速分发,保障高效稳定的用户体验。
|
19天前
|
人工智能 机器人 Serverless
云端问8期-实践教学
云端问8期-实践教学
|
人工智能 编解码 监控
|
SQL 安全 网络安全
直播软件源码开发搭建提高安全性方案
直播软件源码平台的防火墙功能是极为重要,且不可或缺的,它的加入有效提高了直播软件源码平台的安全性,保护了用户的信息,为用户构建一个绿色安全的直播软件平台。
直播软件源码开发搭建提高安全性方案
|
存储 人工智能 物联网
AI数字人无人直播/真人直播系统开发详细功能/方案设计/案例部署/源码设计
  区块链、人工智能、数字孪生、人机交互、物联网等面向数据的新一代信息技术的演进并非偶然,而是从Web2.0向Web3.0演进的技术准备。从技术上来看,元宇宙是基于Web3.0技术体系和运作机制支撑下的可信数字化价值交互网络,是以区块链为核心的Web3.0数字新生态。元宇宙是以区块链为核心的Web3.0技术体系支撑下的新场景、新产业和新生态,将会在数字环境下催生大量创新商业模式,形成数字空间新范式。
|
人工智能 云计算 开发者
《云端智创—云端智能媒体生产技术解析与实践》电子版地址
本书基于阿里云开发者社区的DeepVideo训练营,搜集整理了阿里云视频云的资深导师们的精彩演讲内容,与各位开发者和视频制作技术朋友分享。
95 0
《云端智创—云端智能媒体生产技术解析与实践》电子版地址
|
存储 人工智能 安全
在线办公大势所趋,细说3种主流云办公方式优劣
云办公会不会在未来五到十年成为普遍现象?当我们在疫情期间不得不加入远程办公行列时,其实这个概念已经早早发芽,在打工人心中蠢蠢欲动。当“云工作”、“云录制”、“云办公”成为流行词并发展成办公主流,对习惯集中上班的人来说,工作上云意味着什么呢?
285 0
|
人工智能 云计算 开发者
《云端智创—云端智能媒体生产技术解析与实践》电子版下载地址
本书基于阿里云开发者社区的DeepVideo训练营,搜集整理了阿里云视频云的资深导师们的精彩演讲内容,与各位开发者和视频制作技术朋友分享。
99 0
《云端智创—云端智能媒体生产技术解析与实践》电子版下载地址