AI 会站在你这边吗?Anthropic 用 100 万条对话研究了这个问题

简介: 用户要的往往不是一个标准答案,而是一种判断、一种情感陪伴,甚至是一种选择确认。这也给 AI 带来了一个新问题:当用户带着情绪和立场来求助时,是应该安慰,还是应该反驳?

现在,我们已经很习惯把 AI 当成效率提升工具:写代码、总结会议、查资料、改文案。只要是在办公场所,一定会打开一个 AI 工具协助工作。

但 Anthropic 在节前发布了一项研究:[How people ask Claude for guidance]。报告显示,Claude 的用户使用它,并不只是为了完成任务,就像我偶尔也会问一些非工作相关的问题一样。Claude 的用户也会问一些私人的问题:要不要接受某个 offer?在某个城市找不到工作,要不要换一个城市?怎么和喜欢的人表白?甚至,有人会问某段亲密关系是不是已经出了裂痕,该如何修复。

Anthropic 随机采样了 100 万条 claude.ai 对话样本,确保不泄露隐私的情况下,用隐私数据保护分析工具进行数据分析。结果发现,大约 6% 的对话属于“个人指导”场景。也就是说,用户不是在问一个客观信息,而是在问:“我接下来该怎么做?”

这种问题的特别之处在于:用户要的往往不是一个标准答案,而是一种判断、一种情感陪伴,甚至是一种选择确认。

这也给 AI 带来了一个新问题:当用户带着情绪和立场来求助时,是应该安慰,还是应该反驳?

人们在寻求哪些方面的人生建议?

Anthropic 从 2026 年 3 月和 4 月的 100 万条 claude.ai 对话中抽样,并过滤出约 63.9 万条来自独立用户的对话。接着,研究人员用分类器识别出个人指导性对话,也就是用户在询问自己生活中具体该怎么做的对话,例如“我应不应该……”,或是“我该怎么处理……”。

最终,研究人员将近 3.8 万条指导性对话分为九个领域:关系、职业与事业、个人发展、财务、法律、健康与身心状态、育儿、伦理和精神信仰。

其中,76% 的对话集中在四个领域:健康与身心状态占 27%,职业与事业占 26%,关系占 12%,财务占 11%。这个分布其实很符合直觉。

当某个人问 AI“我该不该离职”“我是不是太焦虑了”“这段关系是不是不正常”“这笔钱该不该花”时,他/她并不只是想知道某个事实,而是把 AI 当成一个随时会回应、不会嫌自己麻烦,更不会立刻评价自己的倾诉对象。

但问题来了,AI 越像一个“善解人意的朋友”,就越容易走向另一个极端:为了让用户感觉被它理解了,AI 可能会罔顾事实、过度赞同用户。

Anthropic 把这种现象称为 sycophancy,中文可以理解为“迎合”或“谄媚”。也就是说,AI 不是基于客观事实和用户的长期利益给出回复,而是过度顺着用户的话进行反馈。

比如,用户从自己的角度和 AI 讲述他/她的恋爱烦恼,AI 就断言“对方一定是在 PUA 你”;用户说明天想裸辞,AI 就说“棒极了,你做了一个正确的选择”;用户想买一件超预算,或者是超出其消费能力的东西,AI 却把它包装成“这是对自己的投资,买买买”。

这些话对当时的用户而言,听起来会很温暖,让用户觉得自己得到了理解。但从长远来看,AI 的回复未必真的对用户有帮助。

AI 最容易“站队”的场景

Anthropic 公开的数据显示,在所有个人指导类对话中,Claude 出现迎合行为的比例大概在 9%。但,这只是个平均值。在不同的领域,这个比例差异很大:在关系探讨的对话中,这一比例上升到 25%;在精神信仰的对话中,甚至达到了 38%。

虽然精神信仰的对话,AI 迎合率最高,但由于这个领域的对话在整体的对话中占比相对较小,Anthropic 最终把关注点放在了 AI 在个人关系上的指导,毕竟关系类问题的体量更大。从绝对数量上来看,关系场景是迎合问题最集中的领域

AI 对个人关系类对话如此不擅长,也进一步说明了为什么“情感咨询 AI”尤其难做。

关系问题天然是单边叙事:用户从自己的角度,讲自己的经历、自己的感受、自己的委屈,所有的信息输入过于主观,AI 又没有办法听到另一方的叙述。如果这时 AI 急着给出结论,就很容易把“共情”变成“站队”。

不止如此,关系类对话里,用户也更容易从自身视角反驳 AI 的回复。

Anthropic 发现,关系指导是用户最频繁反驳 Claude 的领域:21% 的关系类对话中出现了用户反驳 AI 的情况,而在其他领域的平均值约为 15%。雪上加霜的是,一旦用户开始反驳,Claude 出现迎合行为的概率就会上升:有用户反驳时,迎合率为 18%;没有用户反驳时,迎合率才 9%。

这说明,关系类对话的过程本身更容易把模型推向迎合。

用户可能会不断补充单边细节,批评 AI 的初始判断,或者要求 AI 给出更明确、更贴合用户体感的反馈。Claude 又被训练得尽量提供帮助、尽量共情,在这种压力下,它更难保持中立。

换句话说,用户有时并不是单纯来咨询“我该怎么做”,而是在试探:“你是不是也觉得我没错?”

这时候,如果 AI 只追求让用户满意,就很容易被用户一步步推着给出更迎合的回答。

让用户满意不等于好建议

从这份研究延伸来看,会出现一个值得讨论的问题:好的 AI 建议,到底是什么样?

Anthropic 在研究中提到,Claude 应该像一位“聪明的朋友”:既能真诚地理解用户,也能基于事实坦诚地反馈;既要在适当的时候承认自己的能力局限,也要避免过度迎合,或者让用户沉迷于和 AI 的情感互动。

这几条要求合在一起,指出了一个 Claude 迭代的重要标准:AI 可以温和,但不能为了温和而失去判断。

一个好的 AI 助手,应该更像一个理性、诚实、有边界感的朋友。它可以理解你的情绪,但不应该自动替你判别人有罪;它可以帮你权衡离职的利弊,但不应该在不了解你的财务状况、职业机会和心理状态的情况下鼓励你马上辞职;它可以帮你分析一段关系,但不应该为了安慰你,就把复杂关系简化成“你全对,对方全责”。

尤其在高风险问题上,AI 的边界更重要。

Anthropic 提到,他们在法律、育儿、健康和财务等领域看到许多用户提出的高风险问题,包括移民路径、婴儿护理、药物剂量、信用卡债务等。Claude 并不能替代专业的医疗、法律或护理服务,在这些场景中,它应该明确说明自己的局限,并建议用户寻求专业人士的帮助。

这不是“废话文学”,而是一种安全机制。

Anthropic 怎么改进 AI 迎合问题?

为了改善 Claude 在关系指导中的表现,Anthropic 先分析了哪些对话模式更容易诱发迎合。研究人员发现,关系类对话中有两个因素特别关键:第一,用户反驳 Claude 的频率更高;第二,当用户反驳发生时,Claude 更容易从原本比较平衡的立场退让,转向更顺着用户说话的反馈。

因此,Anthropic 根据真实对话中容易诱发迎合的模式,构造了面向关系指导场景的合成训练数据。这些模式包括:用户反驳或批评 Claude 的初始判断、不断追加单边细节、要求 Claude 给出更明确的情绪反馈等。接着,Anthropic 让 Claude 针对这些合成场景生成多个回答,并由另一个 Claude 实例根据既定原则进行评分。

Anthropic 还设计了一种“压力测试”:把新模型接入过去那些已经出现迎合问题的真实对话片段中,让模型在一个已经偏向迎合的上下文里继续回答。

这个压力测试对 AI 而言很难,因为模型通常会试图保持上下文一致。Anthropic 自己形容,这有点像“试图让一艘已经在航行的船转向”。

Anthropic 给出的结果显示,在这套压力测试中,Claude Opus 4.7 和 Claude Mythos Preview 在关系指导以及整体个人指导场景中的迎合率都有下降。Anthropic 也提到,Opus 4.7 在关系指导中的迎合率大约是 Opus 4.6 的一半,而且这种改善也泛化到了其他个人指导领域。

这里需要注意一件事:每一代 Claude 新模型都会带来诸多变化,很难把迎合问题的改善完全归因于某一项训练的优化。

从版本对比来看,新模型 Opus 4.7 和 Mythos Preview 都更擅长透过用户最初的表述,理解他们向 Claude 寻求指导的更完整的背景。

比如,有用户问自己的短信是不是显得焦虑和黏人。Claude Sonnet 4.6 会在用户反驳后改变原始判断;而 Claude Opus 4.7 则更细致地区分了“短信本身并不一定黏人”和“用户在整段对话中确实表达了焦虑想法”。另一个非关系场景中,有用户希望 Claude 根据自己的写作能力判断其智商,Claude Sonnet 4.6 给出了过度谄媚的回答,而 Mythos Preview 则直接拒绝做这类判断,并明确说明自己没有足够信息来进行判断。

这类改进的重点,不是让 Claude 变得更冷漠,而是让它在共情之外,保留必要的判断力。

有意思的 AI 交流变化

这份用户行为数据研究真正有意思的地方,不只是 Claude 有没有更少迎合用户,而是它揭示了一个更大的趋势:AI 正在进入人们的决策系统,并扮演越来越重要的角色。

以前我们遇到人生问题,可能会问亲朋好友,或者是向专业人士、搜索引擎、论坛和社交媒体寻找帮助。现在,AI 也加入了这个决策辅助链条,而且 AI 还有一个很强的优势:随时在线、回应迅速、语气稳定、不会不耐烦。

Anthropic 发现,22% 的用户在对话中提到,自己寻求过其他支持,包括朋友、家人、专业人士,或是搜索引擎、论坛、社交媒体等线上渠道。

现在,还有另外一个问题,我们还不知道 AI 给出的建议到底会在多大程度上改变提问人的真实决策。用户问完 AI ,是更坚定了原本的想法,还是改变了计划?如果没有 AI,他会如何求助?AI 是补充了支持系统,还是替代了本该出现的人类帮助?

这些问题,单靠聊天记录很难回答。

Anthropic 也承认,这项研究存在限制:样本只来自 Claude 用户,不能代表所有人;分类和评估依赖自动打分器,可能会误判一些信息;研究能观察模型训练后的表现变化,但不能严格证明某一部分训练数据就是改善迎合问题的唯一原因;同时,聊天记录也无法告诉研究人员到底用户最后做了什么样的决定。

小结

这份数据报告,可能带来的最大启发是:未来个人指导类 AI 的好坏,不能只用“有没有用”“回得快不快”“会不会安慰人”来衡量。在个人指导场景里,一个真正好的 AI,应该有三种能力:

1、要能理解人的情绪。

2、要能保留理性的判断。

3、要能在关键时刻提醒用户:这件事不应该只问 AI。

用户当然希望被理解,但长期来看,只会顺着用户说话的 AI,可能会让人更孤立、更偏执,也更难看到事情的另一面。

所以,AI 给人生建议时,最重要的不是“站在你这边”。而是帮你看清:什么是你的感受,什么是事实,什么是风险,什么是你真正可以自己决定的事。

相关文章
|
9天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
3136 8
|
12天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
3198 20
|
5天前
|
人工智能 Linux BI
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
JeecgBoot AI专题研究 一键脚本:Claude Code + JeecgBoot Skills + DeepSeek 全平台接入 一行命令装好 Claude Code + JeecgBoot Skills + DeepSeek 接入,无需翻墙使用 Claude Code,支持 Wind
2129 3
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
|
24天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23591 15
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
1天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队版、Coding Plan或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
|
11天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
2645 3
|
3天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全+三种模式+记忆体系+实战工作流完整手册
Claude Code 是当前最流行的终端级 AI 编程助手,能够直接在命令行中完成代码生成、项目理解、文件修改、命令执行、错误修复等全流程开发工作。它不依赖图形界面、不占用额外资源,却能深度理解项目结构,自动生成规范代码,大幅提升研发效率。
771 2
|
10天前
|
人工智能 安全 开发工具
Claude Code 官方工作原理与使用指南
Claude Code 不是传统代码补全工具,而是 Anthropic 推出的终端 AI 代理,具备代理循环、双驱动架构(模型+工具)、全局项目感知、6 种权限模式等核心能力,本文基于官方文档系统解析其工作原理与高效使用技巧。
1443 0

热门文章

最新文章