多模态大模型调用 Token 计费标准是什么？

多模态大模型调用的 Token 计费标准依据模型类型、输入/输出内容模态（文本、音频、图片/视频）以及是否使用优化功能（如 Batch 调用或上下文缓存）而有所不同。以下是阿里云百炼平台中部分多模态模型的具体计费标准（单位：元/每百万 Token），在阿里云百炼AI大模型平台查看精准报价：https://t.aliyun.com/U/fPVHqY 如下图：

阿里云百炼ai大模型价格.jpg

1. Qwen3-Omni 系列（中国内地）

以 qwen3-omni-flash 为例：

输入单价：
- 文本：3.156 元
- 音频：27.962 元
- 图片/视频：5.725 元
输出单价：
- 纯文本输入场景下的文本输出：12.183 元
- 多模态输入场景下的文本输出：22.458 元
- 文本+音频输出（仅音频计费）：110.896 元

2. Qwen3-Omni-Realtime 系列（中国内地）

以 qwen3-omni-flash-realtime 为例：

输入单价：
- 文本：2.2 元
- 音频：18.9 元
- 图片：3.9 元
输出单价：
- 纯文本输入场景下的文本输出：8.3 元
- 多模态输入场景下的文本输出：15.2 元
- 文本+音频输出（仅音频计费）：75.1 元

3. Qwen3-VL 系列（视觉语言模型）

以 qwen3-vl-plus 为例（中国内地）：

按输入 Token 长度分段计价：
- 0–32K：输入 1 元，输出 10 元
- 32K–128K：输入 1.5 元，输出 15 元
- 128K–256K：输入 3 元，输出 30 元
  （注：该模型支持 Batch 调用享半价，上下文缓存享有折扣）

4. 计费优化机制

Batch 调用：若模型支持，输入和输出 Token 单价均按实时推理价格的 50% 计费。
上下文缓存：
- 创建缓存：新增部分按标准输入单价的 125% 计费；
- 命中缓存：按标准输入单价的 10%（显式缓存）或 20%（隐式缓存，适用于阿里云百炼部署的多数模型）计费。

综上，多模态模型的计费需结合具体模型名称、输入/输出模态类型及是否启用优化策略综合判断，详细价格请以阿里云百炼控制台为准。

多模态大模型调用 Token 计费标准是什么？

1. Qwen3-Omni 系列（中国内地）

2. Qwen3-Omni-Realtime 系列（中国内地）

3. Qwen3-VL 系列（视觉语言模型）

4. 计费优化机制

相关文章

相关解决方案

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

多模态大模型调用 Token 计费标准是什么？

1. Qwen3-Omni 系列（中国内地）

2. Qwen3-Omni-Realtime 系列（中国内地）

3. Qwen3-VL 系列（视觉语言模型）

4. 计费优化机制

相关文章

相关解决方案