在阿里云ECS云服务器上免费一键安装部署DeepSeek图文教程

简介: 近年来,开源大模型 DeepSeek-R1 凭借其对标 OpenAI o1 正式版的性能表现,以及后训练阶段大规模强化学习技术的应用,在极少标注数据场景下仍能保持高效推理能力,迅速成为 AI 领域的焦点,吸引了众多开发者与企业用户关注。为帮助用户便捷体验其功能,本文提供在阿里云 ECS 主机上免费一键安装部署 DeepSeek-R1 的详细流程,覆盖环境准备、部署操作、功能测试等全环节,适用于不同技术背景的用户。

近年来,开源大模型  DeepSeek-R1 凭借其对标 OpenAI o1  正式版的性能表现,以及后训练阶段大规模强化学习技术的应用,在极少标注数据场景下仍能保持高效推理能力,迅速成为 AI  领域的焦点,吸引了众多开发者与企业用户关注。为帮助用户便捷体验其功能,本文提供在阿里云 ECS 主机上免费一键安装部署 DeepSeek-R1  的详细流程,覆盖环境准备、部署操作、功能测试等全环节,适用于不同技术背景的用户。

0.png

一、选择阿里云 ECS 主机的核心原因

阿里云 ECS(弹性计算服务)凭借以下特性,成为部署 DeepSeek-R1 的理想载体:

  1. 性能适配性:支持多种实例规格,从入门级 2 核 4G 到高性能 8 核 32G,可满足不同参数规模  DeepSeek-R1 模型(如 7B、13B 版本)的运行需求,且部分实例支持 GPU 加速(如搭载 NVIDIA A10、T4 的 EGS  实例),能显著提升大模型推理速度;
  2. 稳定性保障:提供 99.95% 以上可用性 SLA,采用专有网络 VPC 实现资源隔离,配合安全组规则、DDoS 基础防护等功能,确保模型部署环境的安全性与服务连续性;
  3. 弹性扩展能力:支持 CPU、内存、带宽、存储的弹性升降配,当业务需求增长(如并发请求增加)时,可快速调整实例配置,无需重新部署环境;
  4. 生态兼容性:兼容 Linux 主流操作系统(如 Alibaba Cloud Linux、CentOS),支持 Docker、Ollama 等常用部署框架,且能便捷对接阿里云百炼 API、对象存储 OSS 等产品,拓展模型应用场景。

阿里云服务器ECS: https://www.aliyun.com/product/ecs 如下图:

ecs.png

二、DeepSeek-R1 模型核心优势

在部署前,先明确 DeepSeek-R1 的核心价值,帮助用户判断是否适配自身需求:

  1. 开源免费特性:模型代码与权重完全开源,用户可自由下载、修改、二次开发,无商业使用版权限制,降低 AI 应用开发成本;
  2. 高效推理能力:通过知识蒸馏与强化学习技术优化,在 7B 参数规模下即可达到接近大模型的推理效果,兼顾性能与资源消耗,适配中小规模算力场景;
  3. 多场景适配性:支持文本生成、逻辑推理、代码辅助、联网搜索等功能,可用于智能客服、内容创作、数据分析、开发辅助等多样化场景;
  4. 便捷集成能力:提供 API 接口调用方式,可轻松与企业现有系统(如 OA、CRM)、Web 应用、移动端 APP 集成,降低开发门槛。

阿里云DeepSeek帮助文档:https://help.aliyun.com/zh/model-studio/deepseek-api

三、部署前准备:ECS 实例规格与环境要求

(一)ECS 实例规格选择建议

DeepSeek-R1 模型不同参数版本对算力需求差异较大,需根据部署的模型版本选择匹配的 ECS 实例,以下为 2025 年阿里云 ECS 主流实例规格参考:

DeepSeek-R1 模型版本 推荐 ECS 实例类型 实例配置(CPU / 内存) 存储要求 网络要求 适用场景
7B(轻量版) 通用算力型 u1 实例 2 核 4G 或 4 核 8G 40G+ ESSD 云盘 3M+ 固定带宽 个人测试、小型应用对接
7B(性能版)/13B 经济型 e 实例 / 企业级 c7 4 核 16G 或 8 核 32G 80G+ ESSD 云盘 5M+ 固定带宽 企业轻量业务、中等并发请求
13B(GPU 加速版) 弹性 GPU 服务(EGS) 4 核 32G + NVIDIA T4/A10 100G+ NVMe 云盘 10M+ 固定带宽 高并发推理、低延迟需求场景

说明:若选择 GPU 实例(如 EGS 的 gn6i 实例,4 核 15G + T4 GPU,月费 1681 元),需确保实例已预装 GPU 驱动(阿里云部分 GPU 实例提供预装镜像,可减少环境配置步骤)。

阿里云GPU云服务器: https://www.aliyun.com/product/egs 如下图:

egs.png egs1.png

(二)基础环境要求

  1. 操作系统:Linux 系统(推荐 Alibaba Cloud Linux 3.2104 LTS 64 位或 CentOS 7.9,兼容性更强,且支持阿里云官方镜像源加速);
  2. 网络配置:ECS 实例需分配公网 IP(固定公网 IP 或弹性公网 EIP),确保能通过公网访问;
  3. 安全组规则:需开放 22 端口(用于 SSH 远程连接)、8080 端口(用于 Open WebUI 访问)、11434 端口(用于 Ollama 服务通信),若需通过 API 公网调用,需额外配置对应端口规则;
  4. 依赖工具:实例需预装 Python 3.8+、pip 20.0+、git、curl,部分部署方案需 Docker 环境(如通过容器部署 Open WebUI)。

四、一键安装部署详细流程

(一)步骤 1:登录阿里云 ECS 控制台并准备实例

  1. 登录控制台:访问阿里云官网(www.aliyun.com),登录账号后进入「ECS 管理控制台」,在左侧导航栏选择「实例与镜像 > 实例」;
  2. 选择 / 创建实例
  • 若已有符合规格的 ECS 实例,确认实例状态为「运行中」,记录其公网 IP 地址(后续远程连接与访问需使用);
  • 若需创建新实例,点击「创建实例」,按以下配置选择(未提及参数保持默认):
  • 付费类型:包年包月(长期使用更划算,新老用户同享优惠,如 2 核 4G 通用算力型 u1 实例年费 199 元);
  • 地域:优先选择用户集中区域(如华东 1・杭州、华北 2・北京),降低网络延迟;
  • 实例规格:参考前文「实例规格选择建议」,如部署 7B 版本可选「通用算力型 u1-2 核 4G」;
  • 镜像:选择「Alibaba Cloud Linux 3.2104 LTS 64 位」;
  • 存储:40G ESSD Entry 云盘(基础需求)或 80G ESSD 云盘(需存储更多模型权重时);
  • 网络:勾选「分配公网 IPv4 地址」,带宽选择 3M+;
  • 安全组:新建或选择已有的安全组,确保开放 22、8080、11434 端口;
  • 完成实例创建后,等待实例启动(约 1-2 分钟),状态变为「运行中」即可继续。

(二)步骤 2:远程连接 ECS 实例

  1. 获取连接信息:在 ECS 实例列表中,找到目标实例,点击右侧「操作 > 远程连接」;
  2. 选择连接方式
  • 新手推荐「通过 Workbench 远程连接」:点击「立即登录」,输入实例登录密码(创建实例时设置,若忘记可通过「重置密码」功能修改),点击「确定」即可进入 ECS 命令行界面;
  • 熟悉 Linux 操作的用户可使用 SSH 工具(如 PuTTY、Xshell):输入公网 IP、端口 22、用户名(默认 root 或 ecs-user)及密码,建立连接;
  1. 验证环境:连接成功后,执行以下命令检查基础工具是否已安装,若提示「command not found」则需先安装:bash

运行

# 检查Python版本
python3 --version
# 检查pip版本
pip3 --version
# 检查git与curl
git --version && curl --version

若需安装缺失工具(以 Alibaba Cloud Linux 为例):

bash

运行

sudo yum update -y
sudo yum install -y python3 python3-pip git curl

(三)步骤 3:安装依赖环境

执行以下命令安装 DeepSeek-R1 所需的 Python 依赖(如 PyTorch、Transformers 框架):

bash

运行

# 更新pip并配置阿里云镜像源(加速下载)
pip3 config set global.index-url https://mirrors.aliyun.com/pypi/simple/
pip3 config set install.trusted-host mirrors.aliyun.com
pip3 install --upgrade pip
# 安装核心依赖
pip3 install torch==2.1.0 transformers==4.35.2 accelerate==0.24.1 sentencepiece==0.1.99

等待依赖安装完成(约 5-10 分钟,视网络速度而定),无报错即表示依赖环境准备就绪。

(四)步骤 4:下载 DeepSeek-R1 源码与一键部署脚本

  1. 克隆官方仓库:执行以下命令从 GitHub 克隆 DeepSeek-R1 源码仓库(若访问 GitHub 较慢,可使用 Gitee 镜像仓库):bash

运行

git clone https://github.com/deepseek-ai/DeepSeek-R1.git
# 进入仓库目录
cd DeepSeek-R1
  • 获取一键部署脚本:仓库内已包含官方提供的install.sh脚本,若缺失可通过以下命令下载:bash

运行

curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/install.sh -o install.sh
# 赋予脚本执行权限
chmod +x install.sh

(五)步骤 5:一键部署 DeepSeek-R1 服务

  1. 执行部署脚本:在 DeepSeek-R1 目录下,运行以下命令启动一键部署:bash

运行

./install.sh
  1. 脚本执行流程:脚本会自动完成以下操作,无需手动干预:
  • 检查并安装缺失的系统依赖(如 Docker、Ollama);
  • 拉取指定版本的 DeepSeek-R1 模型权重(默认 7B 版本,若需部署其他版本,可在脚本中修改MODEL_VERSION参数为13b等);
  • 配置模型运行环境变量(如内存分配、推理精度);
  • 启动 Ollama 服务(用于托管 DeepSeek-R1 模型)与 Open WebUI(提供可视化交互界面);
  1. 确认部署完成:当命令行输出「Installation completed. Service  started successfully」时,说明部署已完成,记录此时提示的「Ollama 服务端口(默认 11434)」与「Open  WebUI 访问地址格式(http://[公网 IP]:8080)」。

五、部署 Open WebUI 与模型服务对接

Open WebUI 是一款友好的大模型交互界面,支持对话管理、模型切换、API 调用配置等功能,以下为部署与配置流程:

(一)步骤 1:部署 Open WebUI

若前文一键部署脚本未自动安装 Open WebUI,可通过以下命令单独部署(基于 Docker,更便捷且环境隔离):

  • 安装 Docker(若未安装):bash

运行

# 安装Docker依赖
sudo yum install -y yum-utils device-mapper-persistent-data lvm2
# 添加Docker镜像源
sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo
# 安装Docker
sudo yum install -y docker-ce docker-ce-cli containerd.io
# 启动Docker服务并设置开机自启
sudo systemctl start docker && sudo systemctl enable docker
  • 拉取 Open WebUI 镜像并启动容器:bash

运行

# 拉取官方镜像(选择适配版本,此处以0.5.10为例)
sudo docker pull ghcr.io/open-webui/open-webui:0.5.10
# 启动容器,映射8080端口与数据目录
sudo docker run -d -p 8080:8080 \
  -v /mnt/open-webui-data:/app/backend/data \
  -e OLLAMA_API_BASE_URL=http://localhost:11434/api \
  --name open-webui \
  ghcr.io/open-webui/open-webui:0.5.10
  1. 其中,OLLAMA_API_BASE_URL指定对接本地 Ollama 服务,确保 Open WebUI 能调用 DeepSeek-R1 模型。

(二)步骤 2:配置 Open WebUI 对接 DeepSeek-R1

  1. 访问 Open WebUI:在本地浏览器输入「http://[ECS 公网 IP]:8080」,首次登录需创建管理员账号(设置用户名、密码);
  2. 添加 DeepSeek-R1 模型
  • 登录后点击右上角头像,选择「管理员面板 > 模型」;
  • 点击「+ 添加模型」,在「模型 ID」处输入「deepseek-r1:7b」(或对应部署的模型版本,如 13B 版本为「deepseek-r1:13b」),「模型来源」选择「Ollama」;
  • 配置模型参数(可选):如「最大上下文长度」设为 4096,「温度」设为 0.7(控制输出随机性),点击「保存」;
  1. 验证模型对接:返回首页,在模型选择下拉框中选择「deepseek-r1:7b」,输入测试 prompt(如「你是谁?请介绍一下自己」),点击发送,若能正常返回模型响应,说明对接成功。

六、功能测试与高级配置

(一)基础功能测试

  1. 文本生成测试:输入「写一篇关于 AI 在教育领域应用的短文,300 字左右」,检查模型输出的逻辑性、流畅度与内容相关性;
  2. 逻辑推理测试:输入「小明有 5 个苹果,分给小红 2 个,又买了 3 个,现在小明有几个苹果?请写出计算过程」,验证模型的基础逻辑能力;
  3. API 调用测试:若需通过 API 集成到其他应用,可在 ECS 实例内执行以下 curl 命令(本地测试):bash

运行

curl http://localhost:11434/api/generate -d '{
  "model": "deepseek-r1:7b",
  "prompt": "解释什么是机器学习",
  "stream": false
}'
  1. 若需公网调用,需将「localhost」替换为 ECS 公网 IP,并确保安全组开放 11434 端口。

(二)高级配置:开启联网搜索功能

DeepSeek-R1 支持通过联网获取实时信息,提升回答时效性,配置步骤如下:

  1. 获取搜索引擎配置
  • 访问 Google Custom Search Engine 控制台(https://cse.google.com/cse/all),创建自定义搜索引擎,记录「Search Engine ID」;
  • 进入 Google Cloud 开发者平台(https://developers.google.com/custom-search/v1/overview),创建 API 密钥,记录「API Key」;
  1. 在 Open WebUI 中配置
  • 进入「管理员面板 > 插件 > 联网搜索」,启用「Google 搜索」插件;
  • 输入获取的「Search Engine ID」与「API Key」,点击「保存」;
  1. 测试联网功能:在对话输入框中输入「2025 年阿里云 ECS 最新优惠活动有哪些?请联网查询」,模型会自动调用搜索引擎获取实时信息并生成回答。

七、常见问题与解决方案

  1. 远程连接失败
  • 检查 ECS 实例状态是否为「运行中」,公网 IP 是否正确;
  • 确认安全组是否开放 22 端口,若未开放,进入「安全组 > 配置规则 > 入方向 > 添加规则」,端口范围填「22/22」,授权对象填「0.0.0.0/0」;
  • 若忘记登录密码,在 ECS 实例列表中点击「更多 > 密码 / 密钥 > 重置密码」,重启实例后生效。
  1. 模型部署后无法启动
  • 检查实例内存是否充足,若部署 7B 模型时内存不足(如 2 核 2G 实例),会导致服务崩溃,需升级实例规格(如改为 2 核 4G);
  • 查看日志定位问题:执行「journalctl -u ollama」查看 Ollama 服务日志,或「docker logs open-webui」查看 Open WebUI 容器日志,根据报错信息修复(如缺失依赖则重新安装)。
  1. Open WebUI 无法访问
  • 检查 ECS 实例公网 IP 是否正确,端口是否为 8080;
  • 确认安全组已开放 8080 端口,且容器正常运行(执行「docker ps」查看 open-webui 容器状态,若未运行则执行「docker start open-webui」);
  • 若使用浏览器访问时提示「无法连接」,可在 ECS 实例内执行「curl http://localhost:8080」,若能返回页面内容,说明问题出在公网网络配置(如安全组、带宽),否则需重启 Open WebUI 服务。
  1. 模型推理速度慢
  • 若为 CPU 实例,可尝试降低模型参数规模(如从 13B 改为 7B),或启用模型量化(在 Ollama 启动命令中添加「--quantize q4_0」参数);
  • 若需显著提升速度,建议升级为 GPU 实例(如阿里云 EGS 的 T4 实例),并确保 GPU 驱动正常(执行「nvidia-smi」检查驱动状态)。

八、总结

通过本文流程,用户可在阿里云  ECS 主机上快速完成 DeepSeek-R1 的免费一键部署,从实例准备到功能测试全程不超过 30 分钟。部署过程中,需重点关注 ECS  实例规格与模型版本的匹配性、安全组端口的开放配置,以及 Ollama 与 Open WebUI  的对接有效性。若需拓展应用场景,可进一步对接阿里云百炼 API 实现更灵活的调用,或通过容器化部署提升环境可移植性。后续若业务需求增长,可利用  ECS 的弹性扩展能力调整配置,确保模型服务稳定运行。

相关文章
|
7天前
|
数据采集 人工智能 安全
|
17天前
|
云安全 监控 安全
|
3天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
285 164
|
2天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
293 155
|
4天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:六十九、Bootstrap采样在大模型评估中的应用:从置信区间到模型稳定性
Bootstrap采样是一种通过有放回重抽样来评估模型性能的统计方法。它通过从原始数据集中随机抽取样本形成多个Bootstrap数据集,计算统计量(如均值、标准差)的分布,适用于小样本和非参数场景。该方法能估计标准误、构建置信区间,并量化模型不确定性,但对计算资源要求较高。Bootstrap特别适合评估大模型的泛化能力和稳定性,在集成学习、假设检验等领域也有广泛应用。与传统方法相比,Bootstrap不依赖分布假设,在非正态数据中表现更稳健。
223 113
|
10天前
|
SQL 自然语言处理 调度
Agent Skills 的一次工程实践
**本文采用 Agent Skills 实现整体智能体**,开发框架采用 AgentScope,模型使用 **qwen3-max**。Agent Skills 是 Anthropic 新推出的一种有别于mcp server的一种开发方式,用于为 AI **引入可共享的专业技能**。经验封装到**可发现、可复用的能力单元**中,每个技能以文件夹形式存在,包含特定任务的指导性说明(SKILL.md 文件)、脚本代码和资源等 。大模型可以根据需要动态加载这些技能,从而扩展自身的功能。目前不少国内外的一些框架也开始支持此种的开发方式,详细介绍如下。
769 5