通过人工智能平台PAI部署DeepSeek-OCR模型 官网控制台部署

简介: 本方案介绍如何在阿里云PAI平台部署DeepSeek-OCR开源模型,涵盖从账号准备、模型部署到应用体验的完整流程。通过PAI的Model Gallery可一键部署,结合PAI-EAS实现高性能推理,支持公网调用。适用于OCR场景快速搭建与测试,体验后建议及时清理资源以避免计费。

方案概览
本方案旨在介绍如何通过人工智能平台 PAI部署DeepSeek-OCR 开源模型。人工智能平台 PAI 为 AI 研发提供了全链路支持,覆盖了从数据标注、模型开发、训练、评估、部署和运维管控的整个 AI 研发生命周期。其中,Model Gallery 组件提供了一个丰富多样的模型资源库,使用户能够轻松地查找、部署、训练和评估模型,大大简化了开发流程。目前 Model Gallery 已接入 DeepSeek-OCR。PAI-EAS 则提供了高性能的模型推理服务,支持多种异构计算资源,并配备了一套完整的运维和监控系统,确保服务的稳定性和高效性。

方案架构
按照本方案提供的配置完成部署后,会在阿里云上搭建一个如下图所示的运行环境。实际部署时,您可根据具体的资源规划调整部分配置,但最终的运行环境将与下图展示的架构相似。
image.png
本方案的技术架构包括以下云服务:

Model Gallery :人工智能平台 PAI 的一个组件,集成了众多 AI 领域高质量的预训练模型。

PAI-EAS :人工智能平台 PAI 的一个组件,针对在线推理场景提供的模型在线服务,采用基于按量付费的 GPU 公共资源组。

部署准备
开始部署前,请按以下指引完成账号申请、账号充值等准备工作。

准备账号
如果您还没有阿里云账号,请访问阿里云账号注册页面,根据页面提示完成注册。阿里云账号是您使用云资源的付费实体,因此是部署方案的必要前提。

为阿里云账号充值。本方案的云资源支持按量付费,且默认设置均采用按量付费引导操作。如果确定任何一个云资源采用按量付费方式部署,账户余额都必须大于等于100元。

部署 DeepSeek-OCR 模型

1.登录PAI 控制台,首次登录需要开通服务。请注意左上角选择需开通的地域。推荐华北6(乌兰察布),有较多可用资源提供。
image.png
2.开通成功后,点击进入控制台按钮。
image.png
3.在工作空间页面的左侧导航栏选择 Model Gallery 。
4.在搜索框中输入DeepSeek-OCR,点击卡片进入模型详情页,然后点击右上角部署按钮。
image.png
5.选择工作空间,点击确定。
6.在弹出的部署面板中,按照以下参数完成部署配置,其余参数保持默认,完成参数配置后单击部署,在计费提醒页面阅读计费信息后,单击确定,完成模型在线服务创建。
推理引擎:选择SGLang。
部署模板:选择单机。
基本信息:保持默认不变
部署资源:资源类型选择公共资源,资源规格选择ml.gu7i.c16m60.1-gu30。
说明
若当前区域中某规格的计算资源库存不足,您可以尝试选择资源规格列表中其他规格实例或在控制台左上角切换至其他区域如华北6(乌兰察布)寻找计算资源。
7.在人工智能平台PAI控制台左侧导航栏,单击Model Gallery > 任务管理,当服务部署完成后状态会切换为运行中。在部署任务列表页找到目标服务并单击服务名称,进入服务详情页。
image.png
8.单击查看调用信息,在弹出的面板中复制保存公网调用地址和 Token 。
image.png
应用体验
一、使用 Chatbox 客户端进行对话
访问 Chatbox 下载地址下载并安装客户端,本方案以 macOS M3 为例。
image.png
image.png
image.png
image.png
image.png
最终配置如下图所示,然后单击检查,等待提示连接成功后即代表模型提供方添加成功。
image.png
image.png
返回主界面点击新对话,并点击image图标针对OCR模型特性进行进一步设置。image.png
对话设置中删除所有系统提示,并关闭流式输出后点击保存。image.png
在文本输入框中可以输入图片并搭配提示词进行对话交互。此处以对收据图片进行OCR提取为例。image.png
清理资源

若不用于生产环境,建议在体验后按提示清理资源,避免继续产生费用。如因资源不足一直等待中,请注意停止模型服务,否则一旦资源充足会自动重试创建成功。

删除1个模型在线服务(EAS):

登录人工智能平台PAI控制台,在左侧导航栏选择模型部署 > 模型在线服务(EAS),在模型在线服务列表页面找到目标服务,在其右侧操作列,单击删除。
更多大模型可以在[体验中心里]面试用,免费领取tokens

相关文章
|
25天前
|
SQL 分布式计算 大数据
【跨国数仓迁移最佳实践8】MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破
本系列文章将围绕东南亚头部科技集团的真实迁移历程展开,逐步拆解 BigQuery 迁移至 MaxCompute 过程中的关键挑战与技术创新。本篇为第八篇,MaxCompute Streaming Insert:大数据数据流写业务迁移的实践与突破。 注:客户背景为东南亚头部科技集团,文中用 GoTerra 表示。
265 38
|
16天前
|
人工智能 前端开发 算法
大厂CIO独家分享:AI如何重塑开发者未来十年
在 AI 时代,若你还在紧盯代码量、执着于全栈工程师的招聘,或者仅凭技术贡献率来评判价值,执着于业务提效的比例而忽略产研价值,你很可能已经被所谓的“常识”困住了脚步。
959 78
大厂CIO独家分享:AI如何重塑开发者未来十年
|
5天前
|
云安全 监控 安全
|
16天前
|
人工智能 Java API
Java 正式进入 Agentic AI 时代:Spring AI Alibaba 1.1 发布背后的技术演进
Spring AI Alibaba 1.1 正式发布,提供极简方式构建企业级AI智能体。基于ReactAgent核心,支持多智能体协作、上下文工程与生产级管控,助力开发者快速打造可靠、可扩展的智能应用。
1182 41
|
1天前
|
人工智能 运维 负载均衡
AgentRun上线!5分钟完成企业级Agent构建
阿里云发布函数计算AgentRun,基于Serverless架构打造一站式Agentic AI基础设施,深度融合AI场景,实现毫秒级弹性、按需付费、安全沙箱与全链路可观测,助力企业降本60%,加速AI Agent高效落地生产环境。
64 0
AgentRun上线!5分钟完成企业级Agent构建
|
3月前
|
传感器 算法 机器人
【IMU数据与GPS融合的预积分方法】基于流形的IMU预积分,用于高效的视觉惯性最大后验估计、SE3姿势区分为IMU(Matlab代码实现)
【IMU数据与GPS融合的预积分方法】基于流形的IMU预积分,用于高效的视觉惯性最大后验估计、SE3姿势区分为IMU(Matlab代码实现)
170 4
|
3月前
|
人工智能 Ubuntu 固态存储
《2核2G阿里云神操作!Ubuntu+Ollama低成本部署Deepseek模型实战》
本文详解如何在阿里云2核2G轻量服务器上,通过Ubuntu系统与Ollama框架部署Deepseek-R1-Distill-Qwen-1.5B大模型。涵盖环境搭建、Ollama安装、虚拟内存配置及模型运行全流程,助力开发者以极低成本实现AI模型云端运行。
709 1
《2核2G阿里云神操作!Ubuntu+Ollama低成本部署Deepseek模型实战》
|
8月前
|
存储 机器学习/深度学习 芯片
微软推出bitnet-b1.58-2B-4T:极致的量化,小巧而强大
随着大语言模型的发展,参数量逐渐扩大,大语言模型的训练和运行通常需要大量的计算资源,这也限制了大语言模型在一些场景尤其是端侧的应用,所以,探索剪枝,蒸馏等量化方式,已经成为大语言模型研究的一个重要方向。
537 3
|
4月前
|
人工智能 自然语言处理 前端开发
牛x,这也许是Coze(字节)平替,AIFlowy:企业级AI应用开发平台
AIFlowy 是一个基于 Java 的企业级开源 AI 应用开发平台,专为中国 toB 场景打造。它提供可视化 AI 工作流编排、大模型配置与市场、RAG 知识库、Bot 应用、素材中心及系统管理模块,帮助企业快速构建和部署 AI 应用。平台支持多样模型接入、复杂流程组装、素材生成及系统治理,适用于智能客服、知识运营、营销素材生产等场景。技术栈成熟,本土化支持良好,具备完整的开发、部署和管理能力,是企业级 AI 落地的理想选择。
409 0