使用PAI-EAS一键部署ChatGLM及LangChain应用

本文涉及的产品
模型训练 PAI-DLC,5000CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: 本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。

使用PAI-EAS一键部署ChatGLM及LangChain应用


1. 实验资源方式简介及开始实验

云起实验室实验资源方式介绍

云起实验室支持开通免费试用、个人账户资源两种实验资源方式。

领取免费试用额度

使用个人账号开通试用,平台仅提供手册参考。

所有实验操作将保留至您的账号,请谨慎操作。

在实验页面下方卡片会展示本实验支持的试用规格,可以选择你要试用的云产品资源进行开通。您在实验过程中,可以随时用右下角icon唤起试用卡片。阿里云支持试用的产品列表、权益及具体规则说明请参考开发者试用中心

说明:试用云产品开通在您的个人账号下,并占用您的试用权益。如试用超出免费试用额度,可能会产生一定费用。

个人账户资源

使用您个人的云资源进行操作,资源归属于个人。

所有实验操作将保留至您的账号,请谨慎操作。

平台仅提供手册参考,不会对资源做任何操作。

说明:使用个人账户资源,在创建资源时,可能会产生一定的费用,请您及时关注相关云产品资源的计费概述。

准备开始实验

在实验开始前,请您选择其中一种实验资源,单击确认开启实验

说明:每个实验所支持的实验资源方式都不相同,实验不一定能满足有三种实验资源方式,请根据实验的实际情况,进行选择。


2. 准备环境及资源

实验前必看!

开始教程前,请按以下步骤准备环境和资源:

重要:PAI-EAS抵扣包只适用于本教程中的PAI-EAS产品。如果您领取了PAI-EAS抵扣包后,使用了PAI-EAS及PAI的其他产品功能(如PAI-DSW、PAI-DLC等),PAI-EAS产品产生的费用由抵扣包抵扣,其他产品功能产生的费用无法抵扣,会产生对应的费用账单

如果您的阿里云账号只能领取部分免费试用产品,请您领取符合免费试用资格的产品,然后进入实验,不满足免费试用资格的产品将会使用个人账户资源进行创建,并会产生一定的费用,请您及时关注账户扣费

为了避免资源浪费并造成账号扣费的情况,请严格按照本文提供的参数进行配置。在实验完成之后,请您及时删除或禁用压测任务。

在实验开始前,请您选择领取免费试用额度

申请免费使用PAI-EAS。

模型在线服务PAI-EAS卡片上单击立即试用

模型在线服务PAI-EAS面板,勾选服务协议后,单击立即试用,如弹出新的页面,您可先忽略。

领取完免费试用后,返回资源领取界面,单击我已开通,进入实验

说明:第一次使用控制台需要创建默认工作空间,步骤如下,若开通过则跳过此步骤

4.1 前往PAI控制台

4.2 开通机器学习PAI并创建默认工作空间。其中关键参数配置如下。

本教程地域选择:华南2(河源)

组合开通:本教程无需使用其他产品,去除勾选MaxCompute和DataWorks产品。如果您勾选了MaxCompute和DataWorks产品,在开通时会产生如下图报错。

服务角色授权:单击去授权,完成服务角色授权。

说明:更多详细内容,请参见开通并创建默认工作空间。如果您后续使用RAM用户来部署模型,您需要将RAM用户添加为默认工作空间的成员,并配置管理员角色,详情请参见管理成员;同时,需要为RAM用户授予PAI-EAS的管理权限,详情请参见云产品依赖与授权:EAS

2.3 返回如下页面,表示您已成功开通机器学习PAI并创建默认工作空间。

说明: 如果您在开通时出现Create workspace failed, status: FAILURE!报错提示,您可忽略此报错,继续进行下一步实验操作。


3. 开通工作空间

若您的免费试用资格已过期或已无试用资格,您可以使用个人账户资源, 计费标准详情请参考计费概述。如需长期使用本服务,请仔细阅读计费概述,避免产生意料之外的费用;如仅为体验功能不做长期使用,完成实验后请及时清理

选择个人账号资源,点击确认开启实验。

创建模型在线服务PAI-EAS。

说明:您此步的创建会用您个人的资源,使用期间可能会产生费用。

2.1 前往PAI控制台

2.2 开通机器学习PAI并创建默认工作空间。其中关键参数配置如下。如果您已经开通了工作空间,可直接前往控制台。

本教程地域选择:华南2(河源)

组合开通:本教程无需使用其他产品,去除勾选MaxCompute和DataWorks产品。如果您勾选了MaxCompute和DataWorks产品,在开通时会产生如下图报错。

服务角色授权:单击去授权,完成服务角色授权。

说明:更多详细内容,请参见开通并创建默认工作空间。如果您后续使用RAM用户来部署模型,您需要将RAM用户添加为默认工作空间的成员,并配置管理员角色,详情请参见管理成员;同时,需要为RAM用户授予PAI-EAS的管理权限,详情请参见云产品依赖与授权:EAS

2.3 返回如下页面,表示您已成功开通机器学习PAI并创建默认工作空间。

说明: 如果您在开通时出现Create workspace failed, status: FAILURE!报错提示,您可忽略此报错,继续进行下一步实验操作。


4. 进入PAI EAS模型在线服务页面

进入PAI EAS模型在线服务页面。

登录PAI控制台

在左侧导航栏单击工作空间列表,在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。

在工作空间页面的左侧导航栏选择模型部署>模型在线服务(EAS),进入PAI EAS模型在线服务页面。


5. 部署ChatGLM模型服务

在PAI EAS模型在线服务页面,单击部署服务

部署服务页面,配置以下关键参数。

参数

描述

服务名称

自定义服务名称。本案例使用的示例值为:chatglm_demo

部署方式

选择镜像部署AI-Web应用

镜像选择

在PAI平台镜像列表中选择chatglm-webui;镜像版本选择1.0

说明 :由于版本迭代迅速,部署时镜像版本选择最高版本即可。

运行命令

选择镜像版本后系统自动配置运行命令python webui/webui_server.py --listen --port=8000和端口号:8000。

其中:命令行参数--listen用于将WebUI服务或程序绑定到外部服务连接,从而使WebUI服务或程序能够接收外部服务的请求并对其进行处理。

资源组种类

选择公共资源组

资源配置方法

选择常规资源配置

资源配置选择

  • 如果您使用免费试用资源,本教程实例规格选择试用活动页签的ecs.gn7i-c8g1.2xlarge.limit
  • 如果您使用个人账户资源,本教程实例规格选择GPU页签的ml.gu7i.c16m60.1-gu30

说明阿里云免费试用提供的机型包括以下三种机型,仅选择试用活动页签下的这三种机型来部署服务产生的费用,才能使用抵扣包抵扣。 ecs.g6.xlarge.limit ecs.gn6i-c8g1.2xlarge.limit ecs.gn7i-c8g1.2xlarge.limit

使用免费试用资源:试用活动-ecs.gn7i-c8g1.2xlarge.limit

b. 使用个人资源:GPU-ml.gu7i.c16m60.1-gu30

单击部署,等待一段时间即可完成模型部署

当服务状态为运行中时,表明服务部署成功。


6. 启动WebUI进行模型推理

单击目标服务服务方式列下的查看Web应用

在WebUI页面,进行模型推理验证。

在①位置输入请求数据,单击②位置的发送按钮,即可在③位置输出推理结果。


7. 使用langchain来集成自己的业务数据

LangChain功能介绍:

LangChain是一个开源的框架,可以让AI开发人员将像GPT-4这样的大语言模型(LLM)和外部数据结合起来,从而在尽可能少消耗计算资源的情况下,获得更好的性能和效果。

LangChain工作原理:

将一个大的数据源,比如一个20页的PDF文件,分成各个区块,然后把它们嵌入到一个向量存储(Vector Store)里。

LangChain首先将输入的用户数据进行自然语言处理并作为大模型的知识库存储在本地。每次推理用户的输入会首先在本地知识库中查找与输入问题相近的答案,并将知识库答案与用户输入一起输入大模型生成基于本地知识库的定制答案。

设置方法:

在WebUI页面上方Tab页选择LangChain

在WebUI页面左下角,按照界面操作指引拉取自定义数据,支持配置.txt、.md、.docx、.pdf格式的文件。

例如上传README.md文件,单击左下角的知识库文件向量化,返回如下结果表明自定义数据加载成功。

在WebUI页面底部输入框中,输入业务数据相关的问题进行对话即可。

例如在输入框中输入如何安装deepspeed,单击发送,返回结果如下图所示。


8. (可选)启动模型服务

说明:如果您部署的模型状态为运行中您可忽略此步骤。

如果30分钟未调用服务,服务实例会自动缩容为0,模型状态为已停止

如果需要再次使用,请在PAI EAS模型在线服务页面中,单击上述步骤中部署模型操作列下的启动。当模型状态已停止变为运行中,表明服务已运行正常。


9. 清理

清理

领取抵扣包后,请在抵扣包额度和有效期内使用。如果抵扣包额度用尽或超出有效期,继续使用计算资源,会产生后付费账单。

请前往节省计划页面,查看抵扣包剩余金额和过期时间。

如果无需继续使用EAS服务,您可以按照以下操作步骤删除模型服务。

登录PAI控制台

在页面左上方,选择服务的地域。

在左侧导航栏单击工作空间列表,在工作空间列表页面中单击默认工作空间名称,进入对应工作空间内。

在工作空间页面的左侧导航栏选择模型部署>模型在线服务(EAS),进入PAI EAS模型在线服务页面。

在推理服务页签,单击目标服务操作列下的删除,删除模型服务。

如果需要继续使用EAS服务,请务必至少在抵扣包额度用尽或试用到期1小时前为您的阿里云账号充值,到期未续费的EAS服务会因欠费而被自动停止。

实验链接:https://developer.aliyun.com/adc/scenario/96067309564244e8a373a69401281f2d

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
相关文章
|
16天前
|
机器学习/深度学习 人工智能 物联网
通义灵码在人工智能与机器学习领域的应用
通义灵码不仅在物联网领域表现出色,还在人工智能、机器学习、金融、医疗和教育等领域展现出广泛应用前景。本文探讨了其在这些领域的具体应用,如模型训练、风险评估、医疗影像诊断等,并总结了其提高开发效率、降低门槛、促进合作和推动创新的优势。
通义灵码在人工智能与机器学习领域的应用
|
17天前
|
机器学习/深度学习 传感器 自动驾驶
探索机器学习在图像识别中的创新应用
本文深入分析了机器学习技术在图像识别领域的最新进展,探讨了深度学习算法如何推动图像处理技术的突破。通过具体案例分析,揭示了机器学习模型在提高图像识别准确率、效率及应用场景拓展方面的潜力。文章旨在为读者提供一个全面的视角,了解当前机器学习在图像识别领域的创新应用和未来发展趋势。
|
2月前
|
机器学习/深度学习 数据采集 算法
深入了解机器学习:从入门到应用
【10月更文挑战第6天】深入了解机器学习:从入门到应用
|
26天前
|
机器学习/深度学习 人工智能 自然语言处理
思通数科AI平台在尽职调查中的技术解析与应用
思通数科AI多模态能力平台结合OCR、NLP和深度学习技术,为IPO尽职调查、融资等重要交易环节提供智能化解决方案。平台自动识别、提取并分类海量文档,实现高效数据核验与合规性检查,显著提升审查速度和精准度,同时保障敏感信息管理和数据安全。
86 11
|
26天前
|
机器学习/深度学习 数据采集 运维
智能化运维:机器学习在故障预测和自动化响应中的应用
智能化运维:机器学习在故障预测和自动化响应中的应用
51 4
|
28天前
|
机器学习/深度学习 TensorFlow API
机器学习实战:TensorFlow在图像识别中的应用探索
【10月更文挑战第28天】随着深度学习技术的发展,图像识别取得了显著进步。TensorFlow作为Google开源的机器学习框架,凭借其强大的功能和灵活的API,在图像识别任务中广泛应用。本文通过实战案例,探讨TensorFlow在图像识别中的优势与挑战,展示如何使用TensorFlow构建和训练卷积神经网络(CNN),并评估模型的性能。尽管面临学习曲线和资源消耗等挑战,TensorFlow仍展现出广阔的应用前景。
55 5
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
因果推断方法为特征工程提供了一个更深层次的框架,使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要,如经济学、医学和市场营销。
69 1
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
|
2月前
|
机器学习/深度学习 自然语言处理 JavaScript
信息论、机器学习的核心概念:熵、KL散度、JS散度和Renyi散度的深度解析及应用
在信息论、机器学习和统计学领域中,KL散度(Kullback-Leibler散度)是量化概率分布差异的关键概念。本文深入探讨了KL散度及其相关概念,包括Jensen-Shannon散度和Renyi散度。KL散度用于衡量两个概率分布之间的差异,而Jensen-Shannon散度则提供了一种对称的度量方式。Renyi散度通过可调参数α,提供了更灵活的散度度量。这些概念不仅在理论研究中至关重要,在实际应用中也广泛用于数据压缩、变分自编码器、强化学习等领域。通过分析电子商务中的数据漂移实例,展示了这些散度指标在捕捉数据分布变化方面的独特优势,为企业提供了数据驱动的决策支持。
84 2
信息论、机器学习的核心概念:熵、KL散度、JS散度和Renyi散度的深度解析及应用
|
2月前
|
机器学习/深度学习 数据采集 自然语言处理
【机器学习】大模型驱动下的医疗诊断应用
摘要: 随着科技的不断发展,机器学习在医疗领域的应用日益广泛。特别是在大模型的驱动下,机器学习为医疗诊断带来了革命性的变化。本文详细探讨了机器学习在医疗诊断中的应用,包括疾病预测、图像识别、基因分析等方面,并结合实际案例进行分析。同时,还展示了部分相关的代码示例,以更好地理解其工作原理。
69 3
【机器学习】大模型驱动下的医疗诊断应用
|
1月前
|
机器学习/深度学习 数据采集 Python
从零到一:手把手教你完成机器学习项目,从数据预处理到模型部署全攻略
【10月更文挑战第25天】本文通过一个预测房价的案例,详细介绍了从数据预处理到模型部署的完整机器学习项目流程。涵盖数据清洗、特征选择与工程、模型训练与调优、以及使用Flask进行模型部署的步骤,帮助读者掌握机器学习的最佳实践。
77 1

热门文章

最新文章

相关产品

  • 人工智能平台 PAI