开发者社区 问答 正文

按量付费调用大模型 Token 单价有没有浮动?

按量付费调用大模型 Token 单价有没有浮动?开通阿里云百炼AI大模型平台:https://t.aliyun.com/U/fPVHqY 可以免费领取超7000万Tokens,每个大模型100万Tokens,如下图:

阿里云百炼AI大模型免费领取7000万tokens.jpg

展开
收起
用数据说话 2026-05-23 20:01:55 19 分享 版权
1 条回答
写回答
取消 提交回答
  • 按量付费调用大模型的 Token 单价存在浮动,详细参考阿里云百炼AI大模型官网查看:https://t.aliyun.com/U/fPVHqY

    阿里云百炼ai大模型价格.jpg

    主要体现在以下两种机制中:

    1. 阶梯计费:部分模型(如 qwen3-coder 系列、qwen3.5-flash 等)根据单次请求的输入 Token 总量划分计费区间。一旦输入 Token 数落入更高阶梯,该请求的全部输入和输出 Token 均按对应阶梯的单价结算。
      例如,qwen3.5-flash-2026-02-23 在中国内地部署时:

      • 输入 ≤128K:输入 0.15 元/百万 Token;
      • 128K < 输入 ≤256K:输入 0.6 元/百万 Token;
      • 256K < 输入 ≤1M:输入 1.2 元/百万 Token。
    2. 调用方式影响单价

      • 使用 Batch 调用时,成功请求的输入和输出 Token 单价均为实时推理价格的 50%
      • 使用 上下文缓存时,命中缓存的输入 Token 可享折扣(隐式缓存按 20%,显式缓存按 10% 计费)。

    综上,Token 单价并非固定,会因请求规模、调用方式及是否启用优化功能而动态变化。

    2026-05-23 20:27:45
    赞同 10 展开评论
问答分类:
问答地址: