MiniMax M2.1开源:多语言编程SOTA,为真实世界复杂任务而生

简介: MiniMax正式开源M2.1模型,全面提升多语言编程、办公自动化与原生App开发能力,支持WebDev、3D渲染、Agent工具链等复杂任务,性能媲美Claude Opus,免费开放体验。

今天,MiniMax正式开源了其M2模型的升级版本MiniMax-M2.1,此次迭代聚焦于提升模型在真实世界复杂任务中的实用性,尤其针对多语言编程与办公场景进行了重点优化。

模型:

https://www.modelscope.cn/models/MiniMax/MiniMax-M2.1

GitHub:

https://github.com/MiniMax-AI/MiniMax-M2.1

MiniMax M2.1 具体模型亮点如下:

  • 卓越多编程语言能力:M2.1系统性提升了 Rust / Java / Golang / C++ / Kotlin / Objective-C / TypeScript / JavaScript 等语言的能力,多语言任务整体表现达到业内领先水平,覆盖从底层系统到应用层开发的完整链路。
  • WebDev 与 AppDev:针对业界普遍存在的移动端开发短板,M2.1 显著加强了原生 Android / iOS 开发能力。 同时,官方系统性提升了模型在 Web 与 App 场景中的设计理解与美学表达能力,能够出色地构建复杂交互、3D 科学场景模拟与高质量可视化表达,推动 vibe coding 成为可持续、可交付的生产实践。
  • 复合指令约束提升,办公场景变为可能:作为开源模型中率先系统性引入 Interleaved Thinking 的模型系列,M2.1 systematic problem-solving 能力再次升级。模型不仅关注代码执行是否正确,同时关注模型对“复合指令约束”的整合执行能力,在真实办公场景具备更高的可用性。
  • 更简洁高效的回复:相比 M2,MiniMax M2.1 的模型回复以及思维链更加简洁,在实际编程与交互体验中,响应速度显著提升,Token 消耗明显下降,在 AI Coding 与 Agent 驱动的连续工作流中更加流畅和高效。
  • 出色的 Agent / 工具脚手架泛化能力:M2.1 在各类编程工具与 Agent 框架中均有出色表现。在 Claude Code、Droid(Factory AI)、Cline、Kilo Code、Roo Code、BlackBox 等工具中展现一致且稳定的效果,并对 Skill.md、Claude.md / agent.md / cursorrule、Slash Command 等 Context Management 机制提供可靠支持。
  • 高质量对话和写作:M2.1 不再只是“代码能力更强”,在日常对话、技术说明与写作场景中,也能提供更具细节与结构性的回答。

基准测试概览

在软件工程相关场景的核心榜单上,MiniMax M2.1 相比于 M2 有了显著的提升,尤其是在多语言场景上,超过 Claude Sonnet 4.5 和 Gemini 3 Pro,并接近 Claude Opus 4.5。

研究团队在不同 coding agent 框架上测试了 SWE-bench Verified,结果表明 MiniMax M2.1 具有良好的框架泛化性和稳定的表现。而在公开的测试用例生成、代码性能优化,以及自建的代码审阅(SWE-Review)、指令遵从(OctoCodingBench)等细分场景的榜单上,MiniMax M2.1 相比 M2 都表现出了全面的提升,持平或超过 Claude Sonnet 4.5。

为了衡量模型“从零到一”构建完整、可运行应用程序的全栈能力,M2.1构建并开源了全新基准 VIBE (Visual & Interactive Benchmark for Execution in Application Development),涵盖了 Web、仿真 (Simulation)、Android、iOS 及后端 (Backend) 五大核心子集。不同于传统基准,通过创新的 Agent-as-a-Verifier (AaaV) 范式,VIBE 能够自动评估生成的 Application 在真实运行环境中的交互逻辑与视觉美感。这个评测集稍后将在 Github 上开源。

VIBE:https://www.modelscope.cn/datasets/MiniMax/VIBE

MiniMax-M2.1 在 VIBE 综合榜单中表现卓越,以平均 88.6 分的成绩展现了接近 Claude Opus 4.5 的全栈构建能力,并在几乎所有子集上都显著优于 Claude Sonnet 4.5。

在办公场景、长程工具调用和综合智能指数上,MiniMax M2.1 相比 M2 也表现出稳步提升,体现了模型解决更多真实世界复杂任务的能力。

使用者评价

过去几天,通过 MiniMax 全球的开发者社区,官方开放内测了 M2.1 的模型,也收到了非常多的热心反馈。下面是其中一些国际头部 AI 平台和合作方对 M2.1 的评价,可上下滑动阅读。

Factory AI (Droid):

“我们非常期待像 M2.1 这样强大的开源模型,它在各类软件开发任务中都能带来前沿水准的表现,甚至还能在部分场景下比头部闭源模型更好。开发者应当拥有选择权,而 M2.1 正是大家急需的那个优质选项!”

——Eno Reyes, Co-Founder, CTO

Fireworks:

“MiniMax M2.1 在可读性与惯用结构方面与生产级工程要求高度契合,在 Go、Rust、C++ 等多语言场景下均表现稳定。精炼的交错推理机制显著压缩逻辑路径,减少冗余步骤,让多文件重构与缺陷修复等复杂任务得以更高精度完成。更可贵的是,M2.1 在激活参数量受限的前提下仍能提供可靠性能,为大规模智能体编码流程提供了兼顾效能与资源利用的均衡方案。我们期待与 MiniMax 团队展开持续、紧密的合作,在 Fireworks 平台同步支持其最新创新成果!”

——Benny Chen, Co-Founder

Cline:

“MiniMax M2 系列在代码生成能力上表现突出,过去几个月已迅速跻身 Cline 平台最受欢迎的模型之列。M2.1 再次实现能力层面的显著跃升,我们期待与 MiniMax 团队继续深化合作,共同推进 AI 编码技术的演进。”

——Saoud Rizwan, Founder, CEO

Kilo:

“我们对 M2.1 的发布而兴奋!我们的用户已经离不开 MiniMax 提供的最优秀的编程辅助能力和高性价比,内测显示,M2.1 在架构设计、服务编排、代码评审直至部署上线的全链路环节中均表现优异,速度与资源效率均处于领先水平。”

——Scott Breitenother, Co-Founder, CEO

Roo Code:

“我们的用户非常喜欢 MiniMax M2 在编码能力与效率方面的表现。最新发布的 M2.1 在此基础上实现了速度与可靠性的实质性提升,并在更多语言及框架中保持稳定输出。对于强调高吞吐、Agentic Coding 且对速度与成本敏感的研发流程,M2.1 是稳妥且具性价比的选择。”

——Matt Rubens, Co-Founder, CEO

BlackBox:

“将 MiniMax M2 系列集成到 BlackBox 平台对广大用户来说是一次巨大的利好!而 M2.1 的问世,更是定义了编程专用模型能力的新高度。 在实际测试中,我们惊喜地发现 M2.1 处理复杂、多步编程任务的细腻程度和一致性在同类模型中极其罕见。凭借其规模化提供的高质量推理和深度上下文感知能力,MiniMax 已然成为我们助力开发者更高效攻克技术难题的核心引擎。我们已经迫不及待地想看到开发者社区如何利用这些升级后的强大能力,创造出更多可能!”

——Robert Rizk, Co-Founder, CEO

Showcases

物理世界 Agent:

在模型具备足够好的泛化性之后,在虚拟世界中学习到的模型竟然还可以驱动物理世界的机器人,这有些出乎意料。以下是 M2.1 驱动的维他动力的机器狗。

📎0bc3jaaewaaaeeae3ackdfuvasgdjneaasya.f10002.mp4


多语言 Coding:

MiniMax M2.1 基于 React Three Fiber 与 InstancedMesh 构建的“3D 梦幻圣诞树”,成功渲染 7000+ 实例,支持手势交互与复杂粒子动画,展现高难度 3D 渲染能力。

体验地址:https://yuyl27wq92.space.minimax.io/


Web UI 前卫设计:

M2.1 可以生成极简主义摄影师个人主页,运用非对称布局与黑白红撞色设计,结合沉浸式影像和粗犷排版,实现了极具冲击力的视觉效果。

体验地址:https://m6xkaf07udss.space.minimax.io/


原生 App 开发 - 安卓:

M2.1 使用 Kotlin 语言开发了一款安卓原生重力感应模拟器,利用陀螺仪传感器实现丝滑的重力操控体验,并设计巧妙的视觉彩蛋,通过自然的 UI 过渡与碰撞特效,优雅呈现“MERRY XMAS MiniMax M2.1”信息。

📎0bc354abyaaahiabs2skl5uvb36ddtxqahaa.f10002.mp4


原生 App 开发 - iOS:

M2.1 编写了 iOS 桌面交互小组件,设计了“沉睡圣诞老人”点击唤醒机制,逻辑完整且具备原生级的交互动画效果——你的桌面小组件住进了圣诞老人——点他十下,他就醒来送你惊喜!🎅🎁

📎0b2eqaacqaaateac452krnuvbagdfcaaakaa.f10002.mp4


Web 音频模拟开发:

M2.1 基于 Web Audio API 开发了 16 步鼓机模拟器,集成了合成鼓声、非线性节奏算法与实时 Glitch 音效,提供了前卫的电子音乐体验!(可以点开以下视频的声音试听!)

📎0bc37iaauaaa6maahwckubuvb6wdbl5aacqa.f10002.mp4

体验地址:https://21okxwno2u.space.minimax.io


Rust 安全审计 TUI:

M2.1 用 Rust 打造了 CLI + TUI 双模式的 Linux 安全审计利器,支持一键对进程、网络、SSH 等关键项的底层扫描与智能风险评级。

📎0bc3f4aciaaabqacznkkazuval6deqxqajaa.f10002 (1).mp4

Python 数据监控看板:

M2.1 基于 Python 开发了黑客帝国风格的实时数据监控面板,实现了对高频数据流的动态捕捉与渲染。该面板将核心指标转化为赛博朋克视觉符号,在满足实时监控精准度的同时,呈现了独特的科幻美学。

C++ 制作图像渲染:

M2.1 利用 C++ 与 GLSL 实现了复杂光线传输算法,在实时环境下精准还原了水晶球的物理折射、SDF 细致建模的雪人以及波光粼粼的雪地特效。

📎0bc3gyaeuaaahyae252kfzuvanwdji3aasqa.f10002 (2).mp4


Java 制作实时弹幕:

M2.1 基于 Java 实现了高性能实时弹幕系统,简洁直观的用户界面及毫秒级响应能力。

📎0bc3eaaewaaameaey5skfbuvaigdjmqaasya.f10002.mp4

SVG 生成:

M2.1 生成了 SVG 交互式等轴风格岛屿地图,构建了细节丰富的微缩世界,支持一键缩放自由探索四大主题区域。

📎MiniMax M2.1开源多语言编程SOTA为真实世界复杂任务而生 (1).mp4

Agentic Tool Use:

M2.1 展示了 Tool use 能力,自主调用 Excel 工具和 yahoo finance 工具完成了从市场调研数据清洗、分析到图表生成的全流程任务:

📎0bc3liaewaaatuae3ckkcvuvawwdjnnaasya.f10002.mp4

全链路办公自动化:

数字员工是 MiniMax M2.1 模型的重要功能之一。M2.1 能够接受以文字形式展示的网页内容,并以文本形态的输入控制鼠标的点击行为和键盘输入,在日常办公场景下,完成行政、数据科学、财务、人力资源、软件开发类的端到端任务。以下效果演示是 M2.1 在 AgentCompany Benchmark 中的行为轨迹记录。

1) 在通讯软件上主动收集员工的设备请求,然后前往企业内部服务器上搜索相关文档获取设备价格,计算总成本并判断部门预算是否充足,然后记录设备变更——

2) 在项目管理软件上查找被阻塞或积压的问题,然后在通讯软件上查找相关员工并咨询解决方案,根据员工反馈更新问题的状态——

3) 在代码库中查找答案。例如,某同事希望知道改动了某个文件的最近的合并请求是哪一个,检索相关的合并请求,找到编号并告知该同事——


模型使用

MiniMax M2.1 API 已在开放平台上线

https://platform.minimaxi.com/docs/guides/text-generation

(为了保证 M2.1 的使用精度,官方在与多个部署平台对齐测试,并在几天后全面开源权重)


为了方便用户使用,官方提供了两个版本的 API,M2.1 和 M2.1-lightning。这两个 API 结果完全一样,但是后者速度更快,方便对 TPS 有需求的用户来使用。同时,在 M2 手动 Cache 的基础上,M2.1 全面支持自动 Cache,无需设置,自动生效,为开发者带来更流畅的体验、更低的成本与更优的延时表现。


官方在 Coding Plan 里面会根据资源负载给用户提供大比例的 M2.1-lightning,并保持 Coding Plan 的价格不变。也就是说,Coding Plan 用户免费获得了大部分时间更快的推理速度。


直通入口:https://platform.minimaxi.com/subscribe/coding-plan

在魔搭社区通过API Inference体验MiniMax-M2.1模型!

魔搭社区API-Inference 第一时间支持了MiniMax-M2.1的推理体验,欢迎大家前往免费使用~


使用示例:

from openai import OpenAI
client = OpenAI(
    base_url='https://api-inference.modelscope.cn/v1',
    api_key='<MODELSCOPE_TOKEN>', # ModelScope Token
)
response = client.chat.completions.create(
    model='MiniMax/MiniMax-M2.1', # ModelScope Model-Id
    messages=[
        {
            'role': 'system',
            'content': 'You are a helpful assistant.'
        },
        {
            'role': 'user',
            'content': '你好'
        }
    ],
    stream=True
)
for chunk in response:
    if chunk.choices:
        print(chunk.choices[0].delta.content, end='', flush=True)

Intelligence with Everyone.

点击即可跳转模型链接:https://modelscope.cn/models/MiniMax/MiniMax-M2.1

目录
相关文章
|
12天前
|
数据采集 人工智能 安全
|
8天前
|
编解码 人工智能 自然语言处理
⚽阿里云百炼通义万相 2.6 视频生成玩法手册
通义万相Wan 2.6是全球首个支持角色扮演的AI视频生成模型,可基于参考视频形象与音色生成多角色合拍、多镜头叙事的15秒长视频,实现声画同步、智能分镜,适用于影视创作、营销展示等场景。
597 4
|
8天前
|
机器学习/深度学习 人工智能 前端开发
构建AI智能体:七十、小树成林,聚沙成塔:随机森林与大模型的协同进化
随机森林是一种基于决策树的集成学习算法,通过构建多棵决策树并结合它们的预测结果来提高准确性和稳定性。其核心思想包括两个随机性:Bootstrap采样(每棵树使用不同的训练子集)和特征随机选择(每棵树分裂时只考虑部分特征)。这种方法能有效处理大规模高维数据,避免过拟合,并评估特征重要性。随机森林的超参数如树的数量、最大深度等可通过网格搜索优化。该算法兼具强大预测能力和工程化优势,是机器学习中的常用基础模型。
345 164
|
7天前
|
机器学习/深度学习 自然语言处理 机器人
阿里云百炼大模型赋能|打造企业级电话智能体与智能呼叫中心完整方案
畅信达基于阿里云百炼大模型推出MVB2000V5智能呼叫中心方案,融合LLM与MRCP+WebSocket技术,实现语音识别率超95%、低延迟交互。通过电话智能体与座席助手协同,自动化处理80%咨询,降本增效显著,适配金融、电商、医疗等多行业场景。
349 155