Qwen Code 0.16 重磅更新:支持 /goal 命令

简介: Qwen Code 0.16.0 推出 `/goal` 模式:用户只需声明目标(如“迁移到 Vitest”),AI 自主执行、测试、验证。其创新在于引入独立 judge model 进行客观验收,拒绝盲目执行,主动识别不可行任务并说明原因,兼顾自动化与可控性——解放双手,不交出判断权。(239字)

上周三下午三点,我盯着屏幕上一个卡了四小时的 CI 流水线,手里那杯咖啡已经凉得像西伯利亚的冬天。突然想到:如果有个助手能自己发现问题、自己修复、自己跑完测试,那我是不是就能去睡个整觉了?

巧了,这周 Qwen Code 0.16.0 刚好把 /goal 推上了舞台。而更巧的是,隔壁 Codex 也刚上线了类似功能。今天咱们不聊参数对比表,就聊聊:当代码助手开始"自主驾驶",我们程序员到底是解放了,还是失业了?

/goal 到底是啥?

简单说,以前你用 AI 写代码,像带个实习生:每步都要确认,"这个文件改吗?""那个命令跑吗?"。现在 /goal 让你直接说:"把项目从 Jest 迁移到 Vitest",然后——去喝咖啡。

但等等,Codex 不也能这样吗?

关键差异在这里:Qwen Code 的 /goal 请了个"第三方裁判"(judge model)。执行模型负责干活,裁判模型负责验收。就像你装修房子,施工队和监理不能是同一个人,对吧?

# 传统模式(自我判断)
Agent: "我觉得改完了" → 其实漏了三个测试文件 😅

# Qwen 模式(独立裁判)
Executor: "这轮改完了"
Judge: "等等,vitest.config.ts 还没创建,继续"

image.png

这个设计让我想起康德的"批判哲学":理性需要自我批判,但更需要外部审视。代码执行也是同理——让同一个模型既当运动员又当裁判,难免会有"我觉得我行了"的幻觉。

上个月我让某个助手"优化项目性能",结果它把 console.log 全删了,包括生产环境的关键埋点。为什么?因为它觉得"任务完成了"。

Qwen 的 judge model 有个很人性的设计:遇到不可能的目标会主动放弃。比如你说"用纯前端实现比特币挖矿",它不会硬着头皮跑三小时烧你 token,而是直接告诉你:"兄弟,这事儿在浏览器里真干不了"。

这点我特别认同。很多工具为了"显得能干",硬着头皮执行不可能任务,最后留下一堆半成品的代码垃圾。承认"这个我做不到",反而是更高级的智能。

和 Codex 的 /goal:表面相似,内核不同

维度 Codex /goal Qwen Code /goal
完成判断 执行模型自我评估 独立 judge model 验收
失败处理 通常继续尝试或报错 主动放弃 + 原因说明
集成方式 主要面向交互场景 支持 CI/CD 流式输出
风险控制 依赖用户配置 Auto Approval + 风险分类

举个实际场景:你要把 200 个测试文件从 Jest 迁移到 Vitest。

  • Codex 模式:跑着跑着遇到一个特殊语法不支持,可能卡住或乱改,需要你人工介入。
  • Qwen 模式:judge 发现"这个文件依赖了 Jest 特有 API,当前上下文无法处理",直接跳过并记录,最后给你一份"已完成 197 个,3 个需人工处理"的清单。

哪种更让你放心?反正我选后者——毕竟凌晨三点被叫醒改 bug 的体验,一次就够了。

自主与控制的永恒张力

写到这里,突然想起福柯在《规训与惩罚》里说的:权力不是压制,而是生产。AI 编程工具的发展,本质上也是"控制权"的重新分配。

  • 过去:程序员 100% 控制,每行代码亲手写
  • 现在:程序员定义目标,AI 执行细节
  • 未来?:程序员定义"什么是好代码",AI 自主迭代优化

/goal 的 judge model 设计,其实是在"完全放权"和"完全控制"之间找了个平衡点。就像教孩子骑车:一开始扶着后座,后来悄悄松手,但还在旁边看着。

"Man is condemned to be free." — Sartre

我们既渴望解放双手,又害怕失去控制。这种矛盾,可能才是技术演进最底层的驱动力。

结语

回到开头那个凌晨三点的问题:如果 AI 能自己跑完全程,我们还要做什么?

我的答案是:定义什么是"完成"

/goal 的 judge model 之所以重要,不是因为它能判断代码对不对,而是因为它把"验收标准"这个最核心的权力,交还给了人类。你可以说"测试通过就算完成",也可以说"还要通过代码审查",甚至可以自定义一套复杂的验收逻辑。

技术越智能,人的判断力越珍贵。就像相机自动对焦再厉害,构图和光影的审美,永远在摄影师眼里。

所以下次当你输入 /goal 时,不妨多想一秒:我真正想要的"完成",到底是什么样子?

毕竟,工具可以跑完全程,但方向,永远在你手里。🚀


相关文章
|
22天前
|
人工智能 IDE Shell
Zed IDE这个终端新功能,治好了我的窗口切换焦虑
Zed IDE近期发布多项重磅更新,尤其新增“New Center Terminal”功能,让终端可直接在编辑区并排打开,告别拖拽拼图式操作。本文详解其双终端模式、心流提升逻辑及开源协作精神,并展望AI驱动的智能终端未来。(239字)
142 2
|
22天前
|
人工智能 Rust 开发工具
Zed 1.0正式发布:VS Code慌了?
Zed 1.0正式发布!这款用Rust打造、GPU加速的“游戏引擎级”编辑器,告别Electron瓶颈,实现毫秒级响应;原生集成AI多Agent协作,支持DeltaDB字符级同步。它不是VS Code替代品,而是对编辑器本质的重新定义——性能即自由,人机协作为常态。(239字)
190 1
|
22天前
|
算法 安全 程序员
这个主题绝了,转为程序员设计,VS Code完美配合。
这是一款专为开发者设计的VS Code荧光绿主题套件,含6种风格(如Midnight、Liquid Glass),兼顾护眼、降噪与审美。高亮关键字、柔化字符串、弱化注释,提升代码可读性;同步终端配色,消除视觉割裂。小改变,大心流——让眼睛更轻松,思维更专注。(239字)
141 1
|
22天前
|
人工智能 监控 前端开发
Cursor 3.2正式发布:编码彻底并发
Cursor 3.1重磅升级:多任务并行(/multitask)、工作树(隔离想法)、多根工作区(跨仓库协同)三大特性,显著降低决策疲劳与上下文切换负担。工具不再只提效,更在“托住”开发者——省下心力,专注创造。
194 0
|
29天前
|
人工智能 自然语言处理 安全
Claude Code Routines:给你的代码装上“自动巡航“
Routines 是 Claude 的可编程自动化代理,支持定时、API 和 GitHub webhook 三种触发方式,将重复开发任务(如修 Bug、更新文档、安全审查)转为 AI 驱动的云端流水线,解放开发者专注高价值工作。
400 1
|
1月前
|
开发工具 git C++
Git 2.54发布:重写历史不再“伤筋动骨“,钩子终于能“云同步“了!
Git 2.54 发布:聚焦日常体验升级!新增 `git history`(轻量重写历史)、配置化 hooks(全局/局部灵活管理)、几何压缩默认启用。增强 `add -p`、支持 Unicode 别名、HTTP 429 自动重试等。不炫技,只解痛——让工具更懂你。
184 1
|
1月前
|
人工智能 开发者 C++
Claude Code 搞了个UltraPlan:Agent开始上云写代码了!
UltraPlan是Anthropic推出的AI编程新范式:将代码规划“动脑”环节移至云端,终端专注“动手”,实现不卡顿、可协作、灵活执行。支持精准评论、异步运行与多端同步,兼顾效率与隐私选择权。(239字)
284 5
|
1月前
|
人工智能 IDE 开发工具
Zed 编辑器小修小补:让 diff 颜色终于“说人话“了!
本文详解Zed IDE在diff颜色语义化上的精妙改进:新增行用绿色、删除行用红色,真正符合直觉;通过专属token解耦样式与语义,提升主题兼容性与可维护性,并为未来扩展预留接口。小改动,大体验!
157 1
|
1月前
|
人工智能 前端开发 IDE
Cursor 3.1 更新:智能体窗口终于「摊平」了,说话即编程!
Cursor 3.1重磅更新!平铺布局支持多智能体分屏协作,语音输入2.0实现高准度实时转写,新增分支预选防误操作,Diff跳转+文件筛选提升代码审查效率。真实场景驱动,丝滑体验拉满——懂开发者,更懂痛点。(239字)
343 0