一、引言
随着AI技术的日新月异,越来越多的企业、组织和个体开发者都在积极寻求如何利用AI提升工作效率、优化决策,从而挖掘新的价值。然而,在实际的AI开发过程中,开发者和团队经常需要花费大量时间在数据标注、模型训练等重复性任务上,这些障碍不仅影响项目的进展速度,还可能降低模型的质量及最终的应用效果。
本文将以 Qwen2.5 : 7B 为例进行演示,介绍如何通过人工智能平台 PAI实现AI 研发的全链路支持,覆盖了从数据标注、模型开发、训练、评估、部署和运维管控的整个AI研发生命周期。通过 PAI的Model Gallery 和 PAI-EAS(弹性推理服务),只需几分钟就能轻松部署阿里云大规模语言和多模态系列模型 Qwen2.5!甚至整个部署过程完全不需要编写代码,无论您是初学者还是资深专家,都可以快速完成部署并立即投入使用。其中,Model Gallery 组件提供了一个丰富多样的模型资源库,使用户能够轻松地查找、部署、训练和评估模型,大大简化了开发流程。PAI-EAS 则提供了高性能的模型推理服务,支持多种异构计算资源,并配备了一套完整的运维和监控系统,确保服务的稳定性和高效性。
此外,还可以根据实际需求选择其他参数规模的 Qwen2.5 模型,并相应调整实例规格配置,或者使用 PAI-DSW 和 PAI-DLC 进行模型的微调训练,以便更好地满足特定业务场景的需求,进一步提高模型的性能、准确性和适用性。点击文末阅读原文查看方案详情,了解更多关于如何利用PAI平台加速您的AI项目,实现更高的生产力和创新力。
二、方案架构与部署
(一)方案架构
(二)部署准备与模型选择
Model Gallery 集成了众多AI开源社区中优质的预训练模型,支持零代码实现模型训练(微调)、模型压缩、模型评测、模型部署的全部过程。
- 准备工作:登录PAI 控制台,并在工作空间中选择Model Gallery
- 选择模型:本文以Qwen2.5-7B-Instruct为例进行演示,可根据实际需求选择其他参数的Qwen2.5模型。进入模型详情页后点击右上角部署按钮。
- 参数选择:资源配置选择推荐使用GPU:ml.gu7i.c8m30.1-gu30。其余配置项保持默认不变,点击左下角部署按钮。
(三)使用 WebUI 调用 Qwen2.5 模型
完成前期准备及模型选择后,将通过 PAI-EAS 的Web UI 来实现模型调用。
- 点击查看 Web 应用并打开 WebUI 页面。在当前页面可以配置模型的各种参数,比如温度、Top K 、Top P 等。
- 在文本输入框中可以进行对话交互。输入问题或者指令后,点击 Send 按钮即可调用模型服务。
- Qwen2.5 模型具备支持超过 29 种语言的能力,例如能够用法语进行自我介绍。
- 融入领域专业专家模型,Qwen2.5 的知识广度和在编码与数学领域的能力都显著提升。可以提出一道数学题,Qwen2.5 能够给出正确的解答。
(四)PAI-EAS 管理模型服务
- 点击PAI 控制台左侧导航栏中的模型在线服务 (EAS)可以看到当前部署的服务。
- 点击服务名称,进入服务详情页。通过 PAI-EAS 可以全面管理模型服务,包括但不限于查看服务状态、在线调试服务、扩缩容实例,以及实时监控服务性能。
来源 | 阿里云开发者公众号