Nature:人类亲吻难题彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具-阿里云开发者社区

Nature:人类亲吻难题彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

2025-01-24 62

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 近期，《自然》杂志发表的研究显示，所有大型语言模型（LLM）在解释特定情境下人类亲吻行为时均失败。尽管LLM在语言处理和文本生成上表现出色，但在理解和推理复杂人类行为方面存在显著限制，表明其缺乏对人类情感、社会及文化背景的深入理解。专家认为LLM更像是工具而非智能体，虽在客户服务、内容创作等领域有价值，但在复杂推理和理解方面仍显不足。

近期，一项发表在《自然》杂志上的研究表明，当面对一个关于人类亲吻的难题时，所有的大型语言模型（LLM）都遭遇了失败。这一发现引发了关于LLM在理解和推理复杂人类行为方面的能力的讨论。

这个难题是关于两个人之间的亲吻行为。问题要求LLM解释为什么在特定情境下，一个人会亲吻另一个人。这个情境包括两个人的关系、他们的情感状态以及他们所处的环境。

研究中测试了多个知名的LLM，包括GPT-4、Bard和Claude等。然而，这些模型都无法给出令人满意的答案。它们要么给出了错误的解释，要么无法提供任何有意义的回答。

这一发现表明，尽管LLM在处理语言和生成文本方面表现出色，但它们在理解和推理复杂人类行为方面仍存在显著限制。这可能是因为LLM缺乏对人类情感、社会和文化背景的深入理解。

一些专家认为，LLM更像是工具而非智能体。它们可以执行特定的任务，如回答问题或生成文本，但它们缺乏真正的理解和推理能力。这意味着LLM可能无法在需要复杂推理和理解的领域中发挥重要作用。

然而，这并不意味着LLM没有价值。它们在许多领域中已经取得了显著的成功，如客户服务、内容创作和教育等。LLM可以帮助人们更高效地完成任务，并提供有用的信息和建议。

论文地址：https://www.nature.com/articles/s41598-024-79531-8

Nature:人类亲吻难题彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Nature:人类亲吻难题彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

热门文章

最新文章

相关课程

相关电子书

相关实验场景