开发者社区 问答 正文

多模态大模型调用 Token 计费标准是什么?

阿里云多模态大模型调用 Token 计费标准是什么?目前开通阿里云百炼AI大模型平台:https://t.aliyun.com/U/fPVHqY 可以免费领取超7000万Tokens,每个大模型100万Tokens,如下图:

阿里云百炼AI大模型免费领取7000万tokens.jpg

展开
收起
用数据说话 2026-05-23 20:01:55 21 分享 版权
1 条回答
写回答
取消 提交回答
  • 多模态大模型调用的 Token 计费标准依据模型类型、输入/输出内容模态(文本、音频、图片/视频)以及是否使用优化功能(如 Batch 调用或上下文缓存)而有所不同。以下是阿里云百炼平台中部分多模态模型的具体计费标准(单位:元/每百万 Token),在阿里云百炼AI大模型平台查看精准报价:https://t.aliyun.com/U/fPVHqY 如下图:

    阿里云百炼ai大模型价格.jpg

    1. Qwen3-Omni 系列(中国内地)

    qwen3-omni-flash 为例:

    • 输入单价
      • 文本:3.156 元
      • 音频:27.962 元
      • 图片/视频:5.725 元
    • 输出单价
      • 纯文本输入场景下的文本输出:12.183 元
      • 多模态输入场景下的文本输出:22.458 元
      • 文本+音频输出(仅音频计费):110.896 元

    2. Qwen3-Omni-Realtime 系列(中国内地)

    qwen3-omni-flash-realtime 为例:

    • 输入单价
      • 文本:2.2 元
      • 音频:18.9 元
      • 图片:3.9 元
    • 输出单价
      • 纯文本输入场景下的文本输出:8.3 元
      • 多模态输入场景下的文本输出:15.2 元
      • 文本+音频输出(仅音频计费):75.1 元

    3. Qwen3-VL 系列(视觉语言模型)

    qwen3-vl-plus 为例(中国内地):

    • 按输入 Token 长度分段计价:
      • 0–32K:输入 1 元,输出 10 元
      • 32K–128K:输入 1.5 元,输出 15 元
      • 128K–256K:输入 3 元,输出 30 元
        (注:该模型支持 Batch 调用享半价,上下文缓存享有折扣)

    4. 计费优化机制

    • Batch 调用:若模型支持,输入和输出 Token 单价均按实时推理价格的 50% 计费。
    • 上下文缓存
      • 创建缓存:新增部分按标准输入单价的 125% 计费;
      • 命中缓存:按标准输入单价的 10%(显式缓存)或 20%(隐式缓存,适用于阿里云百炼部署的多数模型)计费。

    综上,多模态模型的计费需结合具体模型名称、输入/输出模态类型及是否启用优化策略综合判断,详细价格请以阿里云百炼控制台为准。

    2026-05-23 20:27:44
    赞同 9 展开评论
问答分类:
问答地址: