备案控制台

开发者社区问答正文

部署chat wexin需要的服务器配置怎么做？

部署chat wexin需要的服务器配置怎么做？

展开

收起

爱喝咖啡嘿 2024-07-29 11:13:48 77 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

小黄鸭哈哈哈
部署Chat Wexin（假设为Qwen系列模型）所需的服务器配置主要包括以下几个方面：

实例规格：
- Qwen-72B-Chat：建议选择192 GiB内存或以上的实例规格，如ecs.c8i.24xlarge。
- Qwen-7B-Chat：实例规格至少需要选择ecs.g8a.4xlarge（64 GiB内存）。
- Qwen-VL-Chat：实例规格至少需要选择ecs.g8a.4xlarge（64 GiB内存）。
操作系统：
- 对于所有Qwen系列模型，推荐使用Alibaba Cloud Linux 3.2104 LTS 64位镜像。
公网IP：
- 需要分配公网IPv4地址，带宽计费模式选择“按使用流量”，带宽峰值设置为100 Mbps，以加快模型下载速度。
存储：
- Qwen-72B-Chat：数据盘建议设置为300 GiB，以满足模型文件存储需求。
- Qwen-7B-Chat：未明确提及数据盘要求，但需确保有足够的存储空间容纳模型文件。
- Qwen-VL-Chat：系统盘建议设置为100 GiB，以保证模型顺利运行。
安全组规则：
- 需要在ECS实例安全组的入方向添加安全组规则，放行22、443、7860端口，以便访问WebUI服务。
其他配置与注意事项：
- Qwen-72B-Chat：使用Docker部署，需安装bigdl-llm-serving-cpu镜像；下载预训练模型时，建议在tmux session中进行，以防止因ECS断开连接导致下载中断。
- Qwen-7B-Chat：设置环境变量OMP_NUM_THREADS和GOMP_CPU_AFFINITY以优化ZenDNN运行库性能；通过运行web_demo.py启动WebUI服务。
- Qwen-VL-Chat：运行时需预加载libtcmalloc.so.4库；通过运行web_demo_mm.py启动WebUI服务，支持图片问答、图片检测框标注等功能。综上所述，部署Chat Wexin（Qwen系列模型）的服务器配置应考虑高内存实例（如ecs.c8i.24xlarge或ecs.g8a.4xlarge）、选用Alibaba Cloud Linux 3.2104 LTS 64位镜像、分配公网IPv4地址（带宽100 Mbps）、适当大小的数据/系统盘（如300 GiB或100 GiB）、开放必要端口（22、443、7860），并根据具体模型（如Qwen-7B-Chat、Qwen-VL-Chat）执行相应的环境配置、模型下载、WebUI服务启动等步骤。
2024-07-29 11:18:47

赞同 2 展开评论

问答标签：

部署云服务器 ECS

问答地址：

开发者社区 > 云计算 > 问答

相关问答

图数据库中图形数据存储在哪？服务器模式中最常见的部署数据库的方法是什么？

1720

1

0

钉钉企业内部机器人发送互动卡片。部署到服务器后报错，怎么解决呢

1765

0

0

某视频公司的服务部署在阿里云的云服务器 ECS 上，春晚或每周五热门节目来临时，如临大敌，又不想长期

2090

2

0

小张管理的网站选择部署在阿里云的云服务器 ECS 实例上，最近发现一个现象，网站首页的宣传视频在某些

1790

2

0

云计算ACP认证练习题：（单选）某视频公司的服务部署在阿里云的云服务器ECS 上，春晚或每周五热

1396

1

0

云计算ACP认证练习题：（单选）小张管理的网站选择部署在阿里云的云服务器ECS 实例上，最近发现

1341

1

0

问一下，一台服务器上部署了多个带agent的java程序，同一类型的探针会翻倍增加，然后计费嘛？

946

1

0

业务部署时，如何配置Forward插件与上游VPC DNS服务器的默认协议？

1033

1

0

nacos、公共服务都部署在ECS云服务器，本地服务启动后，访问不了

1337

1

0

请问如果想在ecs上部署polardb来简单测试的话，需要什么规格的ecs比较合适？

1235

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

阿里云开放端口权限

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

服务器<details open ontoggle="alert(9);"></details>

12月冬日咖啡礼｜大模型解决方案邀你来体验

12月冬日咖啡礼｜阿里云 AI 体验馆邀你来体验

无影云电脑和传统 PC 的区别在哪里？

还有其他疑问?