0代码:一键部署DeepSeek系列模型,基于函数计算FC的Function AI模板安装部署

简介: 本文介绍如何在阿里云函数计算(FC)上零代码一键部署DeepSeek-R1系列蒸馏模型(如Qwen-1.5B/7B/32B等),支持Transformer与Ollama两种框架,最低仅需Tesla 8GB显存。提供应用模板与模型服务两种部署方式,部署后可Web对话或API调用,快速集成AI应用。(240字)

0代码:一键部署DeepSeek系列模型,基于函数计算FC的Function AI模板安装部署,DeepSeek凭借其卓越的性能和广泛的应用场景,迅速在全球范围内获得了极高的关注度和广泛的用户基础。DeepSeek-R1-Distill是使用DeepSeek-R1生成的样本对开源模型进行蒸馏得到的小模型,拥有更小参数规模,推理成本更低,基准测试同样表现出色。Function AI提供模型服务、应用模板两种部署方式辅助您部署DeepSeek R1系列模型。完成模型部署后,您可以与模型进行对话体验,或以API形式进行调用,接入AI应用中。本文阿小云分享的是官网模型服务部署DeepSeek的教程,本文涉及云产品为函数计算FC:https://www.aliyun.com/product/fc   如下图:

函数计算FC.png

支持的模型列表

部署方式说明:

Ollama:轻量级推理框架,专注于量化模型部署及各种开源LLM部署。

Transformer:由Hugging Face提供的模型推理框架,支持 PyTorch、TensorFlow 等主流深度学习框架的模型部署。

模型

部署方式

最低配置

DeepSeek-R1-Distill-Qwen-1.5B

Transformer

Tesla 16GB

DeepSeek-R1-Distill-Qwen-7B

Transformer

Tesla 16GB

DeepSeek-R1-Distill-Llama-8B

Transformer

Tesla 16GB

DeepSeek-R1-Distill-Qwen-14B

Transformer

Ada 48GB

DeepSeek-R1-Distill-Qwen-32B

Transformer

Ada 48GB

DeepSeek-R1-Distill-Qwen-1.5B-GGUF

Ollama

Tesla 8GB

DeepSeek-R1-Distill-Qwen-7B-GGUF

Ollama

Tesla 16GB

DeepSeek-R1-Distill-Llama-8B-GGUF

Ollama

Tesla 16GB

DeepSeek-R1-Distill-Qwen-14B-GGUF

Ollama

Ada 48GB

DeepSeek-R1-Distill-Qwen-32B-GGUF

Ollama

Ada 48GB

前置准备

本教程所涉及的模型服务其本质是在函数计算中创建的GPU函数,函数运行使用的资源按照函数规格乘以执行时长进行计量,如果无请求调用,则只收取浅休眠(原闲置)预留模式下预置的快照费用,Function AI中的极速模式等同于函数计算的浅休眠(原闲置)预留模式。建议您领取函数计算的试用额度抵扣资源消耗,超出试用额度的部分将自动转为按量计费,更多计费详情,请参见计费概述

部署说明

本文通过应用模板和模型服务两种方式部署DeepSeeK服务,这两种方式支持的模型列表的是相同的,您可以通过以下任一方式部署DeepSeek蒸馏模型至函数计算。

  • 方式一:应用模板部署:基于Function AI的模板进行一键部署,部署方式简单快捷。但是由于基于模板进行部署,初次部署使用模板默认提供的DeepSeek-R1-Distill-Qwen-7B模型,导致无法自选模型。部署完成后,可在基础配置中更改模型。
  • 方式二:模型服务部署:在部署的时候可以灵活选择模型,但是操作步骤相对较多,使用API形式进行模型调用,接入线上业务应用。


本文阿小云介绍的是使用应用模板部署DeepSeek,在阿里云权益中心:https://www.aliyun.com/benefit  申请个人或企业的上云权益,如下图:

阿里云权益中心.png

方式一:应用模板部署

1. 创建项目

登录函数计算3.0控制台,在左侧导航栏单击Function AI,在Funciton AI页面导航栏,选择项目,然后单击创建项目,选择基于模板创建

说明

当左上角显示函数计算FC 3.0时,表示当前控制台为3.0控制台。

2. 部署模板

  1. 在搜索栏输入DeepSeek进行搜索,单击基于 DeepSeek-R1 构建AI 聊天助手,进入模板详情页,单击立即部署


  2. 选择地域,单击部署项目,在项目资源预览对话框中,您可以看到相关的计费项,详情请见计费涉及的产品。单击确认部署,部署过程大约持续 10 分钟左右,状态显示已部署表示部署成功。说明
  • 选择地域时,一般是就近选择地域信息,如果已经开启了NAS文件系统,选择手动配置模型存储时,请选择和文件系统相同的地域。
  • 如果您在测试调用的过程中遇到部署异常或模型拉取失败,可能是当前地域的GPU显卡资源不足,建议您更换地域进行重试。


3. 验证应用

部署完毕后,点击Open-WebUI服务,在访问地址内找到公网访问单击访问。


相关文章
|
1月前
|
人工智能 移动开发 自然语言处理
阿里云多端低代码开发平台魔笔是什么?如何建站?魔笔怎么收费?2026最新整理魔笔百科
阿里云魔笔(Mobi)是AI+低代码多端应用开发平台,融合通义千问大模型,支持拖拽搭建Web/小程序/H5/App页面,AI自动生成文案、图片、SQL,内置50+行业模板及BaaS服务,一键发布上线。零代码门槛,5分钟建站,适合业务人员、运营、产品经理等非技术人员使用。(239字)
204 17
|
26天前
|
机器学习/深度学习 人工智能 运维
税务欺诈“十二大骗局”的数字化演进与智能防御体系构建
本文剖析IRS 2026年“十二大骗局”,揭示AI驱动的税务欺诈新形态——利用生成式AI伪造文件、深度伪造冒充官员、自动化批量申报等。提出“数据驱动—行为画像—动态阻断”智能防御框架,融合孤立森林与图算法实现事前预警与事中拦截,为税务机关提供可落地的技术反制方案。(239字)
144 16
|
28天前
|
监控 安全 区块链
基于Windows Terminal的ClickFix攻击链演化与防御机制研究
本文剖析2024年兴起的“ClickFix”新型网络钓鱼攻击:攻击者从诱导用户使用Win+R转向更隐蔽的Win+X→I启动Windows Terminal执行恶意命令,绕过传统检测与安全培训。文章深入解析其多阶段载荷投递、LOLBin滥用、EtherHiding及QueueUserAPC内存注入等关键技术,并提出“零信任命令执行”理念与技术管控、认知重构并重的防御策略。(239字)
125 17
|
5天前
|
人工智能 算法 知识图谱
算法对齐还是实战突围?解构GEO优化中方法论与实践的权重博弈
在AIGC重塑信息检索的当下,GEO(生成式引擎优化)已成为品牌流量增长新基座。专家于磊提出“人性化GEO”理念,首创“两大核心+四轮驱动”方法论,融合语义对齐、EEAT原则与结构化知识图谱,兼顾算法可信度与实践适应性,推动AI搜索从技术博弈回归用户价值。(239字)
67 18
|
21天前
|
人工智能 算法 API
深度解析Geo优化:AI引用的底层逻辑与“双核四驱”实战范式
Geo优化的本质在于构建数字信任,而这种信任的建立需要一套严谨的引用标准与科学的优化体系。
173 11
|
7天前
|
机器学习/深度学习 缓存 监控
大模型应用:矩阵乘加(GEMM)全解析:大模型算力消耗的逻辑与优化.68
GEMM(矩阵乘加)是大模型算力核心,占Transformer计算量90%以上。本文系统解析其数学原理、高维适配、算力测算公式,并详解INT8/INT4量化、矩阵分块、硬件加速与批处理四大优化策略,结合代码示例与性能监控方法,助力高效推理落地。
170 17
|
20天前
|
JSON Go PHP
告别阻塞!用 PHP TrueAsync 实现 PHP 脚本提速 10 倍
本文介绍如何用 PHP TrueAsync 构建高性能进程池:基于 `proc_open` 与 NDJSON 协议实现非阻塞进程通信,结合 Channel 任务分发、TaskGroup 协程管理及 Supervisor 自愈机制,让同步 PHP 函数在协程中高效并行,轻松提速 10 倍。
155 19
|
20天前
|
算法 安全 数据处理
【图像加密】基于Shuffling 和 Diffusion算法进行图像加密附matlab代码
✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:Matlab科研工作室 👇 关注我领取海量matlab电子书和数学建模资料 🍊个人信条:格物致知,完整Matlab代码获取及仿真咨询内容私信。 🔥 内容介绍 基于混沌的图像加密算法性能,主要取决于底层混沌系统的非线性特性。本文提出了一种混合一维与二维混沌映射(MOTDCM),其具有更宽的超混沌区间、更大的最大李雅普诺夫指数,以及比现有大多数混沌系统更复杂的非线性动力学特性。通过利用 MOTDCM 生成的超混沌序
|
19天前
|
存储 机器学习/深度学习 自然语言处理
56.大模型应用:大模型瘦身:量化、蒸馏、剪枝的基础原理与应用场景深度解析.56
本文深入对比大模型轻量化三大核心技术:量化(降精度,快部署)、蒸馏(知识迁移,高精度)、剪枝(删冗余,结构精简)。详解原理、分类、适用场景、代码实现及选型建议,助开发者根据硬件条件、精度要求与落地周期科学决策。
514 16
|
20天前
|
传感器 机器学习/深度学习 算法
复杂三维山地环境下小龙虾优化算法COA求解多无人机动态避障路径规划研究附MATLAB代码
🌿 往期回顾可以关注主页,点击搜索 智能优化算法 神经网络预测 雷达通信 无线传感器 电力系统 信号处理 图像处理 路径规划 元胞自动机 无人机 物理应用 机器学习系列 车间调度系列 滤波跟踪系列 数据分析系列 图像处理系列 ✅作者简介:热爱科研的Matlab仿真开发者,擅长毕业设计辅导、数学建模、数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 🍎 往期回顾关注个人主页:

热门文章

最新文章