使用ASK容器化部署大语言模型FastChat
1. 计费说明
必看!!必看!!必看!!
本实验为付费体验,需要消耗账号费用。体验后若不再需要使用,请及时释放资源,避免持续产生费用。
计费说明
完成本实验,将要耗费 ACK Serverless Pro 集群的相关云资源费用说明如下。更多信息,请参见 ACK Serverless集群计费说明。
产品名 |
计费类型 |
费用 |
计费链接 |
限时免费 |
目前公测中,限时免费 |
||
按量付费 |
11.74元/小时~15.46元/小时 |
||
按量付费 |
0.78元/小时 |
||
按量付费 |
0.32元/小时 |
2. 创建 ACK Serverless Pro 版集群
- 登录容器服务管理控制台,在左侧导航栏选择集群。
- 在集群列表页面,单击页面右上角的创建集群。
- 在创建集群页面的集群配置中,单击ACK Serverless 集群,根据如下参数说明完成相关配置,其他配置项保持默认值,然后单击下一步:组件配置。
配置项 |
说明 |
示例值 |
集群名称 |
填写集群的名称。 |
fastchat-demo |
集群规格 |
选择集群规格,支持 Pro 版和标准版 |
Pro 版 |
地域 |
选择集群所在的地域。建议选择华北2(北京)地域。 |
华北2(北京) |
API Server 访问 |
ACK Serverless 默认为 API Server 创建一个内网 SLB 实例,您可修改 SLB实 例规格。更多信息,请参见实例规格。 您可设置是否开放使用 EIP 暴露 API Server。 |
选中 |
- 在组件配置中,配置项保持默认,完成组件配置,单击下一步:确认配置。如您无需使用日志服务功能,可以取消选中使用日志服务,避免产生相关费用。
- 在确认配置中,确认配置信息,仔细阅读并选中服务协议,单击创建集群。
请您耐心等待大约3~5分钟,返回如下结果表示集群创建成功。
3. 创建 FastChat 应用
- 在集群列表页面,单击集群名称fastchat-demo进入集群信息页面,然后在左侧导航栏,选择工作负载 > 无状态。
- 在无状态页面,单击使用YAML创建资源。
- 在示例模板下拉列表中,选择自定义,将如下 fastchat 应用的 YAML 示例粘贴至模板,然后单击创建。
apiVersion: apps/v1 kind: Deployment metadata: labels: app: fastchat name: fastchat namespace: default spec: replicas: 1 selector: matchLabels: app: fastchat template: metadata: labels: app: fastchat alibabacloud.com/eci: "true" annotations: k8s.aliyun.com/eci-use-specs: ecs.gn6i-c8g1.2xlarge,ecs.gn5-c8g1.2xlarge,ecs.gn6v-c8g1.8xlarge,ecs.gn6i-c16g1.4xlarge k8s.aliyun.com/eci-extra-ephemeral-storage: 100Gi spec: dnsPolicy: Default containers: - command: - sh - -c - "/root/webui.sh" image: yunqi-registry.cn-shanghai.cr.aliyuncs.com/lab/fastchat:v1.1.0 imagePullPolicy: IfNotPresent name: fastchat ports: - containerPort: 7860 protocol: TCP readinessProbe: failureThreshold: 3 initialDelaySeconds: 5 periodSeconds: 10 successThreshold: 1 tcpSocket: port: 7860 timeoutSeconds: 1 resources: requests: cpu: "8" memory: 16Gi limits: nvidia.com/gpu: 1 --- apiVersion: v1 kind: Service metadata: annotations: service.beta.kubernetes.io/alibaba-cloud-loadbalancer-address-type: internet service.beta.kubernetes.io/alibaba-cloud-loadbalancer-instance-charge-type: PayByCLCU name: fastchat namespace: default spec: externalTrafficPolicy: Local ports: - port: 7860 protocol: TCP targetPort: 7860 selector: app: fastchat type: LoadBalancer
- 在创建页面下方,单击fastchat,查看应用创建进度。
等待Pod状态变为Running,表示fastchat应用部署完成。
4. 访问 FastChat 服务
注意事项
- fastchat-t5-3b-v1.0模型仅支持日常对话,不支持代码生成等高级功能。
- 仅支持英文
访问步骤
- 在左侧导航栏,选择网络>服务,查看您创建的服务fastchat的外部端点,例如8.140.XX.XX:7860。
- 在您的本机浏览器中输入http://8.140.XX.XX:7860,访问和体验fastchat应用。
通过输入问题,然后单击Send,即可体验大语言模型FastChat的聊天功能。
5. 释放资源
必看!!必看!!必看!!
本实验为付费体验,需要消耗账号费用。体验后若不再需要使用,请及时释放资源,避免持续产生费用。
ACK Serverless Pro集群目前处于公测中,可免费试用。但是在使用ACK Serverless Pro集群过程中用到的其他阿里云云产品资源,您需要按照各云产品规定的计费规则,为您使用的资源付费,费用由各云产品收取。体验完成后,请参考以下场景处理集群:
- 如您需要继续使用集群,请确保账户金额不小于100.00元人民币。在使用ACK Serverless Pro版集群过程中用到的其他阿里云云产品资源,相关计费说明,请参见云产品资源计费。
- 如您不需要继续使用ACK Serverless Pro集群,请按照如下步骤释放资源,避免产生资损。
释放容器服务ACK Serverless Pro集群
- 在集群列表页面,找到您已创建的ACK Serverless Pro集群,在右侧操作列,选择更多>删除。
- 在删除集群面板中,选中同时删除集群下的ALB资源、同时删除集群下的PrivateZone资源、我已知晓以上信息并确认删除集群,然后单击确定。
说明:等待大约3~5分钟,ACK Serverless Pro集群即可删除成功。
- 输入手机验证码,然后单击确定,ACK Serverless Pro集群删除完成。
释放NAT网关
- 登录NAT网关管理控制台。
- 在左侧导航栏,选择NAT网关>公网 NAT 网关。
- 在公网NAT网关页面顶部,选择网关所在地域华北2(北京),然后在页面右侧的操作列,单击图标,然后单击删除。
- 在删除网关面板中,选中强制删除(删除 NAT 网关及其包含资源),然后单击确定,NAT 网关删除完成。
释放负载均衡 CLB
- 登录传统型负载负载均衡CLB控制台。
- 在实例管理页面顶部,选择实例所在地域华北2(北京),单击目标实例ID进入实例详情页面。
- 在实例详情页面,单击关闭 删除保护以关闭删除保护开关。
- 返回实例管理页面,单击图标,然后单击释放设置。
- 在释放设置页面,选中立即释放,单击下一步,然后单击确定完成实例释放。
实验地址:https://developer.aliyun.com/adc/scenario/d768d6c9b5ab4bcdb670d75694ca54f0