文档备案控制台

开发者社区问答正文

按量付费调用大模型 Token 单价有没有浮动？

按量付费调用大模型 Token 单价有没有浮动？开通阿里云百炼AI大模型平台：https://t.aliyun.com/U/fPVHqY 可以免费领取超7000万Tokens，每个大模型100万Tokens，如下图：

阿里云百炼AI大模型免费领取7000万tokens.jpg

展开

收起

用数据说话 2026-05-23 20:01:55 151 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

上云小帮手
按量付费调用大模型的 Token 单价存在浮动，详细参考阿里云百炼AI大模型官网查看：https://t.aliyun.com/U/fPVHqY

主要体现在以下两种机制中：
1. 阶梯计费：部分模型（如 qwen3-coder 系列、qwen3.5-flash 等）根据单次请求的输入 Token 总量划分计费区间。一旦输入 Token 数落入更高阶梯，该请求的全部输入和输出 Token 均按对应阶梯的单价结算。
  例如，qwen3.5-flash-2026-02-23 在中国内地部署时：
  
  输入 ≤128K：输入 0.15 元/百万 Token；
  128K < 输入 ≤256K：输入 0.6 元/百万 Token；
  256K < 输入 ≤1M：输入 1.2 元/百万 Token。
2. 调用方式影响单价：
  
  使用 Batch 调用时，成功请求的输入和输出 Token 单价均为实时推理价格的 50%；
  使用 上下文缓存时，命中缓存的输入 Token 可享折扣（隐式缓存按 20%，显式缓存按 10% 计费）。
综上，Token 单价并非固定，会因请求规模、调用方式及是否启用优化功能而动态变化。
2026-05-23 20:27:45

赞同 293 展开评论

问答分类：

人工智能

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

购买阿里国外的云服务器是否可以访问谷歌？

92877

50

0

this xml file does not appear to have any style in

61432

11

0

访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁，您的访问被阻断”，这是什么原因？

142226

16

0

C语言数组赋值报错，打印出来的是乱码，怎么解决？

1620

1

0

#支付宝授权提示请在支付宝客户端打开链接

24954

19

0

阿里云怎样设置二级域名以及域名解析？

66941

14

0

支付宝H5 下载的时候，提示【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】

284789

11

0

基础语言百问-Python

69747

30

0

C语言中default使用注意事项是什么？

1654

1

0

搭建dnf私服需要大概啥配置的

10471

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

我用qoder 和 codex+deepseek 及claude + qwen 3.7同时解题目

阿里云服务器多少钱一年？支持40个连接的配置

阿里云服务器多少钱一年企业用？公司用什么配置？

阿里云服务器多少钱一年？企业用的配置费用价格

阿里云服务器多少钱一年？学生用的配置价格

相关文章

2026年价格最便宜的阿里云服务器选择：38元、99元、199元购买资格、适用场景与选购指南参考

Codex与Claude Code 深度拆解:两代 AI编程智能体的技术本质与Java实战指南

AI研发管理是什么？从工具提效到流程重构

阿里云数据库首场Agentic DB Day落地深圳：AI时代，数据库要“自己长出Agent”

相关解决方案

更多

零代码微调，打造领域专属大模型

告别低效沟通，使用大模型发起语音通话

构建大模型应用的安全防护体系

还有其他疑问?