Qwen2-72B-Instruct的推理服务运行对服务器资源的要求比Qwen2-72B更高吗?
作为Qwen2-72B-Instruct相较于Qwen2-72B模型配置要求确实更高,
在阿里云部分大语言模型的微调、评测与部署实践文档与人工智能API控制台中都有提到相关配置,在人工智能API控制台的具体要求是:
Qwen2-72B-Instruct部署机型选择
如果您的输入token(包含您设定的历史对话)较长,可能需要更大显存的机器进行支持
Qwen2-72B部署机型选择
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。