阶跃星辰 Step 3.5 Flash 上线!更快更强更稳的 Agent 大脑,开源!

简介: 阶跃星辰发布开源大模型Step 3.5 Flash:专为Agent设计,推理速度达350 TPS,支持256K长上下文,采用稀疏MoE+MTP-3+混合注意力架构,在数学与Agent任务上媲美闭源模型,现已全量开放使用。

今天,阶跃星辰正式发布开源 Step 3.5 Flash——具备强大的推理能力与 Agent 智能,为 Agent 而生。

性能 vs 模型尺寸

核心亮点如下:

  • 更快:推理速度最高 350 TPS(单请求代码类任务)
  • 更强:在 Agent 场景和数学任务上媲美闭源模型
  • 更稳:胜任复杂、长链条任务

阴影柱状图为 Step 3.5 Flash 开启 Parallel Thinking 后的增强性能。左侧开源模型按总参数量排序,右侧为闭源模型。XBench-DeepSearch 数据源自官方发布。

不仅需要“更聪明”的模型,更需要“值得信任”、“响应迅速”、“成本可控”的模型。

Step 3.5 Flash 正是为此而来,采用:

  • 稀疏 MoE 架构每个 token 仅激活约 110 亿个参数(总计 1960 亿参数)
  • MTP-3模型一次预测 3 个 Token,效率翻倍
  • 3:1 滑动窗口与全局注意力混合架构(SWA + Full Attention)长文本中只看“重点”,显著降低计算开销,高效处理 256K 上下文

Step 3.5 Flash 现已全量上线,欢迎大家立刻开启体验,希望 Step 3.5 Flash 能够成为受大家喜爱的“Agent 搭子”!

https://www.modelscope.cn/collections/stepfun-ai/Step-35-Flash



Step 3.5 Flash 能做什么

极致生成速度

在阶跃AI APP 上,Step 3.5 Flash 可以快速计算复杂数学题并输出正确答案。

Prompt:请在不使用外部工具的情况下,依次计算并列出以下等差数列的和:从第1项开始,首项为100,公差为-3的前50项和;1³ + 2³ + ... + 10³的和;1! + 2! + 3! + 4! + 5!的和;2^10 + 3^5的和;√144 + ∛125 + ⁴√16的和。

📎0bc3jqadcaaajqaapzl7qzuvatgdgfgaamia.f10002.mp4

(视频全程未加速)

智能体编程

在本案例中,Step 3.5 Flash 基于一段文字 prompt 自动编程输出如下可视化平台结果。

Prompt:气象情报仪表盘——一款受飞行驾驶舱启发的三维地球可视化平台,专为高密度数据环境设计。其搭载的定制 WebGL 2.0 引擎,可实时处理超过 15,000 个动态节点及 WebSocket 遥测数据流。本案例展示了 Step 3.5 Flash 构建低延迟数据管道与高性能地理空间可视化系统的能力,并体现出对系统稳定性和专业级用户体验的专注追求。

📎0bc374abmaaao4annjt4wzuvb76dc37qafqa.f10002.mp4

端云结合

本案例中,用户提出对比 Mac Mini M4 在各平台的价格。Step 3.5 Flash 作为“云端大脑”,将这一复杂需求拆解为针对淘宝、京东和拼多多的具体子任务。这种云端规划显著降低了本地 Step-GUI 的执行难度,使其在从各应用抓取实时数据时获得更高成功率。随后 Step 3.5 Flash 汇总结果,识别出拼多多为最低价平台,并提供购买指南。这充分展现了“云端协同”的优势:云端智能简化本地端执行,从而确保可靠的结果产出。

📎0bc33uaawaaaoyamx2l43juvbxodbpoqacya.f10002.mp4


One More Thing

阶跃已启动 Step 4 模型的训练,邀请大家深度参与共创。不只是使用者,更是定义者!共同定义下一代 Agent 基础模型,一起探索智能上限!

官方Discord 🚀https://discord.gg/RcMJhNVAQc


点击直达模型合集~

https://www.modelscope.cn/collections/stepfun-ai/Step-35-Flash


目录
相关文章
|
11天前
|
JSON 文字识别 API
百度文心开源0.9B参数 PaddleOCR-VL-1.5,全球首个支持异形框定位的文档解析模型!
百度文心开源新一代文档解析模型PaddleOCR-VL-1.5:仅0.9B参数,在OmniDocBench v1.5达94.5%精度,全球首个支持异形框定位,精准识别倾斜、弯折、反光等“歪文档”,集成印章识别、多语种(含藏语/孟加拉语)及古籍解析能力,推理速度超MinerU2.5达43%。(239字)
244 2
|
9天前
|
机器学习/深度学习 自然语言处理 API
Qwen3-Coder-Next开源!推动小型混合模型在智能体编程上的边界
Qwen团队开源Qwen3-Coder-Next:基于Qwen3-Next-80B的轻量级编程智能体模型,采用混合注意力+MoE架构,通过可执行任务合成与强化学习训练,在SWE-Bench Verified达70%+,以仅3B激活参数媲美10–20倍大模型,兼顾高性能与低成本部署。(239字)
457 3
|
13天前
|
人工智能 Linux API
[大模型实战 01] 本地大模型初体验:Ollama 部署与 Python 调用指南
大模型实战系列第一篇。拒绝晦涩理论,直接上手!我会带着各位友人们零基础安装 Ollama,利用国内 ModelScope 极速下载模型,详解服务端口配置与 Python 脚本调用,涵盖显存计算与常见避坑指南。
[大模型实战 01] 本地大模型初体验:Ollama 部署与 Python 调用指南
|
30天前
|
人工智能 安全 调度
AI工程vs传统工程 —「道法术」中的变与不变
本文从“道、法、术”三个层面对比AI工程与传统软件工程的异同,指出AI工程并非推倒重来,而是在传统工程坚实基础上,为应对大模型带来的不确定性(如概率性输出、幻觉、高延迟等)所进行的架构升级:在“道”上,从追求绝对正确转向管理概率预期;在“法”上,延续分层解耦、高可用等原则,但建模重心转向上下文工程与不确定性边界控制;在“术”上,融合传统工程基本功与AI新工具(如Context Engineering、轨迹可视化、多维评估体系),最终以确定性架构驾驭不确定性智能,实现可靠价值交付。
359 41
AI工程vs传统工程 —「道法术」中的变与不变
|
14天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
5565 20
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
3天前
|
数据采集 人工智能 达摩院
达摩院开源RynnBrain:首个支持移动操作的具身大脑基础模型
达摩院发布首个可移动操作的具身基础模型RynnBrain,首创时空记忆与物理空间推理能力,支持视频/图像/文本多模态输入及区域、轨迹等具身输出。开源MOE架构RynnBrain-30B-A3B(仅3B激活参数),在16项基准全面SOTA,并推出全新评测集RynnBrain-Bench。
101 8
|
5天前
|
边缘计算 人工智能 物联网
Ultralytics YOLO26来啦!5种尺寸全家桶,速度与精度兼顾
Ultralytics发布YOLO26,系列迄今最先进、易部署的模型,支持分类、检测、分割、姿态估计等多任务。五种尺寸灵活适配边缘设备,CPU推理提速43%,首创无NMS端到端推理,移除DFL提升兼容性,已上架魔搭社区。(239字)
116 13
|
13天前
|
数据采集 监控 物联网
大模型微调实战——从数据准备到落地部署全流程
本文以7B大模型为例,手把手教你零代码完成办公场景微调:从数据清洗、LoRA轻量训练到效果验证与一键部署,全程无需GPU和编程基础,30分钟快速上手,解决“通用模型不精准、输出不可控”痛点,让大模型真正落地业务。
|
5天前
|
缓存 自然语言处理 API
美团开源 LongCat-Flash-Lite:实现轻量化 MoE 高效推理
美团LongCat团队开源68.5B MoE大模型LongCat-Flash-Lite,创新采用N-gram Embedding架构,推理仅激活2.9B–4.5B参数,却在Agent工具调用、代码生成等任务上大幅领先;支持256K长上下文,API生成速度达500–700 token/s,MIT协议开源。
176 6
|
11天前
|
机器学习/深度学习 人工智能 算法
首个2步LoRA!2步实现Qwen-Image-2512高质量图片生成
阿里智能引擎推出Qwen-Image-2512-Turbo,将扩散模型压缩至仅2步生成,提速40倍——5秒内输出4张2K图,效果媲美原模型。融合Reverse-KL蒸馏、热启动与对抗学习,显著提升细节与真实性。已开源,支持ModelScope、呜哩AI及ComfyUI。
227 0

热门文章

最新文章