QPM指的是"Queries Per Minute",即每分钟查询次数,它是衡量服务调用频率的一个指标。
在阿里云通义千问大模型的服务中,不同模型设定了不同的基础限流规则,其中包括了对QPM的限制。
例如,Qwen-Long模型的基础限流配置为每分钟调用次数不超过100 QPM,这意味着在默认情况下,用户每分钟通过API向Qwen-Long模型发起的请求不能超过这个数量,以确保服务的稳定性和公平性。
如果用户的使用需求超过了这一限制,需要通过官方渠道申请提高限流配额。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。