近年来,开源大模型 DeepSeek-R1 凭借其对标 OpenAI o1 正式版的性能表现,以及后训练阶段大规模强化学习技术的应用,在极少标注数据场景下仍能保持高效推理能力,迅速成为 AI 领域的焦点,吸引了众多开发者与企业用户关注。为帮助用户便捷体验其功能,本文提供在阿里云 ECS 主机上免费一键安装部署 DeepSeek-R1 的详细流程,覆盖环境准备、部署操作、功能测试等全环节,适用于不同技术背景的用户。
一、选择阿里云 ECS 主机的核心原因
阿里云 ECS(弹性计算服务)凭借以下特性,成为部署 DeepSeek-R1 的理想载体:
- 性能适配性:支持多种实例规格,从入门级 2 核 4G 到高性能 8 核 32G,可满足不同参数规模 DeepSeek-R1 模型(如 7B、13B 版本)的运行需求,且部分实例支持 GPU 加速(如搭载 NVIDIA A10、T4 的 EGS 实例),能显著提升大模型推理速度;
- 稳定性保障:提供 99.95% 以上可用性 SLA,采用专有网络 VPC 实现资源隔离,配合安全组规则、DDoS 基础防护等功能,确保模型部署环境的安全性与服务连续性;
- 弹性扩展能力:支持 CPU、内存、带宽、存储的弹性升降配,当业务需求增长(如并发请求增加)时,可快速调整实例配置,无需重新部署环境;
- 生态兼容性:兼容 Linux 主流操作系统(如 Alibaba Cloud Linux、CentOS),支持 Docker、Ollama 等常用部署框架,且能便捷对接阿里云百炼 API、对象存储 OSS 等产品,拓展模型应用场景。
阿里云服务器ECS: https://www.aliyun.com/product/ecs 如下图:
二、DeepSeek-R1 模型核心优势
在部署前,先明确 DeepSeek-R1 的核心价值,帮助用户判断是否适配自身需求:
- 开源免费特性:模型代码与权重完全开源,用户可自由下载、修改、二次开发,无商业使用版权限制,降低 AI 应用开发成本;
- 高效推理能力:通过知识蒸馏与强化学习技术优化,在 7B 参数规模下即可达到接近大模型的推理效果,兼顾性能与资源消耗,适配中小规模算力场景;
- 多场景适配性:支持文本生成、逻辑推理、代码辅助、联网搜索等功能,可用于智能客服、内容创作、数据分析、开发辅助等多样化场景;
- 便捷集成能力:提供 API 接口调用方式,可轻松与企业现有系统(如 OA、CRM)、Web 应用、移动端 APP 集成,降低开发门槛。
阿里云DeepSeek帮助文档:https://help.aliyun.com/zh/model-studio/deepseek-api
三、部署前准备:ECS 实例规格与环境要求
(一)ECS 实例规格选择建议
DeepSeek-R1 模型不同参数版本对算力需求差异较大,需根据部署的模型版本选择匹配的 ECS 实例,以下为 2025 年阿里云 ECS 主流实例规格参考:
| DeepSeek-R1 模型版本 | 推荐 ECS 实例类型 | 实例配置(CPU / 内存) | 存储要求 | 网络要求 | 适用场景 |
| 7B(轻量版) | 通用算力型 u1 实例 | 2 核 4G 或 4 核 8G | 40G+ ESSD 云盘 | 3M+ 固定带宽 | 个人测试、小型应用对接 |
| 7B(性能版)/13B | 经济型 e 实例 / 企业级 c7 | 4 核 16G 或 8 核 32G | 80G+ ESSD 云盘 | 5M+ 固定带宽 | 企业轻量业务、中等并发请求 |
| 13B(GPU 加速版) | 弹性 GPU 服务(EGS) | 4 核 32G + NVIDIA T4/A10 | 100G+ NVMe 云盘 | 10M+ 固定带宽 | 高并发推理、低延迟需求场景 |
说明:若选择 GPU 实例(如 EGS 的 gn6i 实例,4 核 15G + T4 GPU,月费 1681 元),需确保实例已预装 GPU 驱动(阿里云部分 GPU 实例提供预装镜像,可减少环境配置步骤)。
阿里云GPU云服务器: https://www.aliyun.com/product/egs 如下图:
(二)基础环境要求
- 操作系统:Linux 系统(推荐 Alibaba Cloud Linux 3.2104 LTS 64 位或 CentOS 7.9,兼容性更强,且支持阿里云官方镜像源加速);
- 网络配置:ECS 实例需分配公网 IP(固定公网 IP 或弹性公网 EIP),确保能通过公网访问;
- 安全组规则:需开放 22 端口(用于 SSH 远程连接)、8080 端口(用于 Open WebUI 访问)、11434 端口(用于 Ollama 服务通信),若需通过 API 公网调用,需额外配置对应端口规则;
- 依赖工具:实例需预装 Python 3.8+、pip 20.0+、git、curl,部分部署方案需 Docker 环境(如通过容器部署 Open WebUI)。
四、一键安装部署详细流程
(一)步骤 1:登录阿里云 ECS 控制台并准备实例
- 登录控制台:访问阿里云官网(www.aliyun.com),登录账号后进入「ECS 管理控制台」,在左侧导航栏选择「实例与镜像 > 实例」;
- 选择 / 创建实例:
- 若已有符合规格的 ECS 实例,确认实例状态为「运行中」,记录其公网 IP 地址(后续远程连接与访问需使用);
- 若需创建新实例,点击「创建实例」,按以下配置选择(未提及参数保持默认):
- 付费类型:包年包月(长期使用更划算,新老用户同享优惠,如 2 核 4G 通用算力型 u1 实例年费 199 元);
- 地域:优先选择用户集中区域(如华东 1・杭州、华北 2・北京),降低网络延迟;
- 实例规格:参考前文「实例规格选择建议」,如部署 7B 版本可选「通用算力型 u1-2 核 4G」;
- 镜像:选择「Alibaba Cloud Linux 3.2104 LTS 64 位」;
- 存储:40G ESSD Entry 云盘(基础需求)或 80G ESSD 云盘(需存储更多模型权重时);
- 网络:勾选「分配公网 IPv4 地址」,带宽选择 3M+;
- 安全组:新建或选择已有的安全组,确保开放 22、8080、11434 端口;
- 完成实例创建后,等待实例启动(约 1-2 分钟),状态变为「运行中」即可继续。
(二)步骤 2:远程连接 ECS 实例
- 获取连接信息:在 ECS 实例列表中,找到目标实例,点击右侧「操作 > 远程连接」;
- 选择连接方式:
- 新手推荐「通过 Workbench 远程连接」:点击「立即登录」,输入实例登录密码(创建实例时设置,若忘记可通过「重置密码」功能修改),点击「确定」即可进入 ECS 命令行界面;
- 熟悉 Linux 操作的用户可使用 SSH 工具(如 PuTTY、Xshell):输入公网 IP、端口 22、用户名(默认 root 或 ecs-user)及密码,建立连接;
- 验证环境:连接成功后,执行以下命令检查基础工具是否已安装,若提示「command not found」则需先安装:bash
运行
# 检查Python版本 python3 --version # 检查pip版本 pip3 --version # 检查git与curl git --version && curl --version
若需安装缺失工具(以 Alibaba Cloud Linux 为例):
bash
运行
sudo yum update -y sudo yum install -y python3 python3-pip git curl
(三)步骤 3:安装依赖环境
执行以下命令安装 DeepSeek-R1 所需的 Python 依赖(如 PyTorch、Transformers 框架):
bash
运行
# 更新pip并配置阿里云镜像源(加速下载) pip3 config set global.index-url https://mirrors.aliyun.com/pypi/simple/ pip3 config set install.trusted-host mirrors.aliyun.com pip3 install --upgrade pip # 安装核心依赖 pip3 install torch==2.1.0 transformers==4.35.2 accelerate==0.24.1 sentencepiece==0.1.99
等待依赖安装完成(约 5-10 分钟,视网络速度而定),无报错即表示依赖环境准备就绪。
(四)步骤 4:下载 DeepSeek-R1 源码与一键部署脚本
- 克隆官方仓库:执行以下命令从 GitHub 克隆 DeepSeek-R1 源码仓库(若访问 GitHub 较慢,可使用 Gitee 镜像仓库):bash
运行
git clone https://github.com/deepseek-ai/DeepSeek-R1.git # 进入仓库目录 cd DeepSeek-R1
- 获取一键部署脚本:仓库内已包含官方提供的
install.sh脚本,若缺失可通过以下命令下载:bash
运行
curl -fsSL https://help-static-aliyun-doc.aliyuncs.com/install-script/deepseek-r1-for-platforms/install.sh -o install.sh # 赋予脚本执行权限 chmod +x install.sh
(五)步骤 5:一键部署 DeepSeek-R1 服务
- 执行部署脚本:在 DeepSeek-R1 目录下,运行以下命令启动一键部署:bash
运行
./install.sh
- 脚本执行流程:脚本会自动完成以下操作,无需手动干预:
- 检查并安装缺失的系统依赖(如 Docker、Ollama);
- 拉取指定版本的 DeepSeek-R1 模型权重(默认 7B 版本,若需部署其他版本,可在脚本中修改
MODEL_VERSION参数为13b等); - 配置模型运行环境变量(如内存分配、推理精度);
- 启动 Ollama 服务(用于托管 DeepSeek-R1 模型)与 Open WebUI(提供可视化交互界面);
- 确认部署完成:当命令行输出「Installation completed. Service started successfully」时,说明部署已完成,记录此时提示的「Ollama 服务端口(默认 11434)」与「Open WebUI 访问地址格式(http://[公网 IP]:8080)」。
五、部署 Open WebUI 与模型服务对接
Open WebUI 是一款友好的大模型交互界面,支持对话管理、模型切换、API 调用配置等功能,以下为部署与配置流程:
(一)步骤 1:部署 Open WebUI
若前文一键部署脚本未自动安装 Open WebUI,可通过以下命令单独部署(基于 Docker,更便捷且环境隔离):
- 安装 Docker(若未安装):bash
运行
# 安装Docker依赖 sudo yum install -y yum-utils device-mapper-persistent-data lvm2 # 添加Docker镜像源 sudo yum-config-manager --add-repo https://download.docker.com/linux/centos/docker-ce.repo # 安装Docker sudo yum install -y docker-ce docker-ce-cli containerd.io # 启动Docker服务并设置开机自启 sudo systemctl start docker && sudo systemctl enable docker
- 拉取 Open WebUI 镜像并启动容器:bash
运行
# 拉取官方镜像(选择适配版本,此处以0.5.10为例) sudo docker pull ghcr.io/open-webui/open-webui:0.5.10 # 启动容器,映射8080端口与数据目录 sudo docker run -d -p 8080:8080 \ -v /mnt/open-webui-data:/app/backend/data \ -e OLLAMA_API_BASE_URL=http://localhost:11434/api \ --name open-webui \ ghcr.io/open-webui/open-webui:0.5.10
- 其中,
OLLAMA_API_BASE_URL指定对接本地 Ollama 服务,确保 Open WebUI 能调用 DeepSeek-R1 模型。
(二)步骤 2:配置 Open WebUI 对接 DeepSeek-R1
- 访问 Open WebUI:在本地浏览器输入「http://[ECS 公网 IP]:8080」,首次登录需创建管理员账号(设置用户名、密码);
- 添加 DeepSeek-R1 模型:
- 登录后点击右上角头像,选择「管理员面板 > 模型」;
- 点击「+ 添加模型」,在「模型 ID」处输入「deepseek-r1:7b」(或对应部署的模型版本,如 13B 版本为「deepseek-r1:13b」),「模型来源」选择「Ollama」;
- 配置模型参数(可选):如「最大上下文长度」设为 4096,「温度」设为 0.7(控制输出随机性),点击「保存」;
- 验证模型对接:返回首页,在模型选择下拉框中选择「deepseek-r1:7b」,输入测试 prompt(如「你是谁?请介绍一下自己」),点击发送,若能正常返回模型响应,说明对接成功。
六、功能测试与高级配置
(一)基础功能测试
- 文本生成测试:输入「写一篇关于 AI 在教育领域应用的短文,300 字左右」,检查模型输出的逻辑性、流畅度与内容相关性;
- 逻辑推理测试:输入「小明有 5 个苹果,分给小红 2 个,又买了 3 个,现在小明有几个苹果?请写出计算过程」,验证模型的基础逻辑能力;
- API 调用测试:若需通过 API 集成到其他应用,可在 ECS 实例内执行以下 curl 命令(本地测试):bash
运行
curl http://localhost:11434/api/generate -d '{ "model": "deepseek-r1:7b", "prompt": "解释什么是机器学习", "stream": false }'
- 若需公网调用,需将「localhost」替换为 ECS 公网 IP,并确保安全组开放 11434 端口。
(二)高级配置:开启联网搜索功能
DeepSeek-R1 支持通过联网获取实时信息,提升回答时效性,配置步骤如下:
- 获取搜索引擎配置:
- 访问 Google Custom Search Engine 控制台(https://cse.google.com/cse/all),创建自定义搜索引擎,记录「Search Engine ID」;
- 进入 Google Cloud 开发者平台(https://developers.google.com/custom-search/v1/overview),创建 API 密钥,记录「API Key」;
- 在 Open WebUI 中配置:
- 进入「管理员面板 > 插件 > 联网搜索」,启用「Google 搜索」插件;
- 输入获取的「Search Engine ID」与「API Key」,点击「保存」;
- 测试联网功能:在对话输入框中输入「2025 年阿里云 ECS 最新优惠活动有哪些?请联网查询」,模型会自动调用搜索引擎获取实时信息并生成回答。
七、常见问题与解决方案
- 远程连接失败:
- 检查 ECS 实例状态是否为「运行中」,公网 IP 是否正确;
- 确认安全组是否开放 22 端口,若未开放,进入「安全组 > 配置规则 > 入方向 > 添加规则」,端口范围填「22/22」,授权对象填「0.0.0.0/0」;
- 若忘记登录密码,在 ECS 实例列表中点击「更多 > 密码 / 密钥 > 重置密码」,重启实例后生效。
- 模型部署后无法启动:
- 检查实例内存是否充足,若部署 7B 模型时内存不足(如 2 核 2G 实例),会导致服务崩溃,需升级实例规格(如改为 2 核 4G);
- 查看日志定位问题:执行「journalctl -u ollama」查看 Ollama 服务日志,或「docker logs open-webui」查看 Open WebUI 容器日志,根据报错信息修复(如缺失依赖则重新安装)。
- Open WebUI 无法访问:
- 检查 ECS 实例公网 IP 是否正确,端口是否为 8080;
- 确认安全组已开放 8080 端口,且容器正常运行(执行「docker ps」查看 open-webui 容器状态,若未运行则执行「docker start open-webui」);
- 若使用浏览器访问时提示「无法连接」,可在 ECS 实例内执行「curl http://localhost:8080」,若能返回页面内容,说明问题出在公网网络配置(如安全组、带宽),否则需重启 Open WebUI 服务。
- 模型推理速度慢:
- 若为 CPU 实例,可尝试降低模型参数规模(如从 13B 改为 7B),或启用模型量化(在 Ollama 启动命令中添加「--quantize q4_0」参数);
- 若需显著提升速度,建议升级为 GPU 实例(如阿里云 EGS 的 T4 实例),并确保 GPU 驱动正常(执行「nvidia-smi」检查驱动状态)。
八、总结
通过本文流程,用户可在阿里云 ECS 主机上快速完成 DeepSeek-R1 的免费一键部署,从实例准备到功能测试全程不超过 30 分钟。部署过程中,需重点关注 ECS 实例规格与模型版本的匹配性、安全组端口的开放配置,以及 Ollama 与 Open WebUI 的对接有效性。若需拓展应用场景,可进一步对接阿里云百炼 API 实现更灵活的调用,或通过容器化部署提升环境可移植性。后续若业务需求增长,可利用 ECS 的弹性扩展能力调整配置,确保模型服务稳定运行。