赢家诅咒+经验主义?刚刚结束的ICLR上,谷歌研究员再批当前AI炼金术通病

简介:

在刚过去的ICLR会议中,谷歌人工智能研究员Ali Rahimi批评了整个机器学习行业对经验法则、试错法和迷信的过分依赖。

去年12月,谷歌公司的人工智能(AI)研究员Ali Rahimi在NIPS大会的演讲中批判了自己的研究领域,他说,计算机通过尝试和错误进行学习的机器学习算法已经成为“炼金术”的一种。

研究人员其实并不知道为什么某些算法行之有效,而其他算法徒劳无益,他们也没有严格的标准来界定AI架构的选择。因此,他获得了现场观众长达40秒的欢呼。

4月30日,Rahimi在加拿大温哥华召开的国际学习表征会议(ICLR)上再次强调了他的观点。在他和同事发表了名为《赢家诅咒?关于速度、进步与经验主义)Winner's Curse? On Pace, Progress, and Empirical Rigor论文中,他们记录了“机器学习炼金术化”的相关案例,并提供了加强AI严谨性问题的解决方案。

0616c98ab925537addb9e0d4f782b91a12fe59fc

Rahimi说:“人工智能领域存在一种‘痛苦’。我们中有很多人都感觉自己使用的是外星技术。”

现代科学中,炼金术常被用来比喻缺乏科学严谨性,没有明确理论基础支持,知其然而不知其所以然的研究工作。

炼金术是中世纪的一种化学哲学的思想和始祖,是当代化学的雏形。其目标是通过化学方法将一些基本金属转变为黄金,制造万灵药及制备长生不老药。现在的科学表明这种方法是行不通的。现代分析心理学的创始人卡尔•古斯塔夫•荣格认为,古代的炼金术实际上是一种人以自己的心灵发展为参照,对自然界现象的投射行为。

——维基百科

“炼金术问题”和“AI的可重复性问题”不同:可重复性问题是指研究人员因为实验的不连续性和研究过程公开实践不一致性,导致无法重复彼此的研究结果。

“炼金术问题”和机器学习中的“黑箱问题”及“可解释性”问题也有区别:后者是指,难以解释特定的AI如何得到其结论。

就像Rahimi所指出的,是“某个机器学习系统是一个黑箱”和“整个领域都变成了黑箱”的区别。

如果没有深入理解构建和训练新算法所需的基本工具,创造AI的研究人员就会像中世纪的炼金术士那样诉诸传闻。François Chollet是一位来自加州山景城的谷歌计算机科学家,他补充道:“人们崇拜草包族科学,依靠民间传说和魔法。”(文摘菌:有关草包族科学,可以看看《别闹了!费曼先生》)

例如,采用一些小算法来调整他们的AI的“学习率“——算法在每次错误后可以自行纠正——而不理解为什么一个结果比其他的好。在其他情况下,AI研究人员对算法的训练更像只是在黑暗中蹒跚而行。

例如,实现了所谓的“随机梯度下降”,以优化算法的参数以尽可能降低故障率。然而,目前尽管有成千上万的学术论文和数不清的方法应用,整个研究过程还是依赖于尝试和错误。

9a0975625773823b3f21c027867746150dd24b9b

梯度下降依靠尝试和错误来优化算法,图为在3D景观中寻找最小值。

Rahimi的论文强调了那些可能出现的精力浪费和次优表现。例如,论文指出,当其他研究人员对一个最先进的语言翻译算法进行大量训练后,简化后的算法其实更好,它能更高效地将英语翻译成德语或法语,这表明算法的原来创作者并不了解那些可以被简化掉的额外部分到底有什么用。

不过,在伦敦的推特机器学习研究人员Ferenc Huszár说,有时候算法里花里胡哨的东西才是唯一好的部分。在某些情况下,一个算法的核心在技术上存在缺陷,这意味着,这算法能有还不错的结果完全归功于其他应用在表面上的技巧。

Rahimi提供了一些关于了解哪种算法效果最好以及什么时候效果最好的建议。他认为,对于初学者来说,研究人员应该像研究翻译算法一样进行“排除法研究”:每次删除一部分算法,以查看每个部分的功能。

呼吁进行“切片分析”,其中详细分析了算法的性能,以了解某些部分的改进可能会在其他地方付出代价。

研究人员应该用许多不同的条件和设置来测试他们的算法,并且应该汇报算法在所有情况下的表现。”

加州大学伯克利分校的计算机科学家Ben Recht是Rahimi的炼金术主题演讲的合著者,他认为人工智能需要借鉴物理学,在物理学领域,研究人员经常将问题缩小到一个更小的“玩具问题”。“物理学家擅长以简单的实验设计从根源上诠释现象。”

一些人工智能研究人员已经开始采用这种方法,为了更好地理解算法的内部机制,在处理大量彩色照片之前,先在小的黑白手写字符上测试图像识别算法。

伦敦DeepMind的计算机科学家CsabaSzepesvári认为,机器学习领域也需要淡化对竞争性测试的重视。目前,如果一篇论文中报告的算法优于某些基准,那这篇论文会比其他深度揭示软件内部运行原理的论文更容易发表。

这就是花式翻译算法如何通过同行评审的原因。他还表示,“科学的目的是产生知识,科学家应该制造一些其他人可以采用和作为他人研究基石的东西。”

当然,并非每个人都同意这种批判。

Facebook的首席人工智能科学家Yann LeCun担心将过多的精力从前沿技术转移到核心理解上,可能会减缓创新速度并阻碍人工智能的实际应用。他表示,“这不是炼金术,而是工程学,工程学本就很混乱。”

Yann LeCun回应说,在科学技术史上,工程学上的进步几乎总是先于理论认识:望远镜诞生先于光学理论,蒸汽机先于热力学,飞机先于空气动力学,无线电和数据通信先于信息论,计算机先于计算机科学。

4810b3fb8914d65f34069d22963c6b474aa88ddb

Ali Rahimi也回应了Yann LeCun对他的批评,感兴趣的话可以看看Reddit上关于炼金术问题的争论(链接内含Ali Rahimi在2017 NIPS上的演讲视频):

https://www.reddit.com/r/MachineLearning/comments/7hys85/n_ali_rahimis_talk_at_nipsnips_2017_testoftime/

Recht却认为在研究中“有条不紊”和“冒险精神”的可以达到平衡:“我们两个都需要。我们需要了解哪些地方出现了失败,以便我们能够建立可靠的系统,并且我们必须推进前沿工作,以便我们可以做出更厉害的系统。”


原文发布时间为:2018-05-7

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关文章
|
8月前
|
人工智能 开发框架 决策智能
谷歌开源多智能体开发框架 Agent Development Kit:百行代码构建复杂AI代理,覆盖整个开发周期!
谷歌开源的Agent Development Kit(ADK)是首个代码优先的Python工具包,通过多智能体架构和灵活编排系统,支持开发者在百行代码内构建复杂AI代理,提供预置工具库与动态工作流定义能力。
1480 3
谷歌开源多智能体开发框架 Agent Development Kit:百行代码构建复杂AI代理,覆盖整个开发周期!
|
3月前
|
人工智能 IDE 开发工具
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
CodeGPT是一款基于AI的编程辅助插件,支持代码生成、优化、错误分析和单元测试,兼容多种大模型如Gemini 2.0和Qwen2.5 Coder。免费开放,适配PyCharm等IDE,助力开发者提升效率,新手友好,老手提效利器。(238字)
988 1
CodeGPT AI代码狂潮来袭!个人完全免费使用谷歌Gemini大模型 超越DeepSeek几乎是地表最强
|
9月前
|
人工智能 自然语言处理
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
谷歌推出专为药物研发设计的TxGemma大模型,具备药物特性预测、生物文献筛选、多步推理等核心能力,提供20亿至270亿参数版本,显著提升治疗开发效率。
322 7
TxGemma:谷歌DeepMind革命药物研发!270亿参数AI药理学家24小时在线
|
9月前
|
人工智能 vr&ar 图形学
谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景
牛津大学与谷歌联合推出的Bolt3D技术,能在单个GPU上仅用6.25秒从单张或多张图像生成高质量3D场景,基于高斯溅射和几何多视角扩散模型,为游戏、VR/AR等领域带来革命性突破。
395 2
谷歌DeepMind联手牛津推出Bolt3D:AI秒速3D建模革命!单GPU仅需6秒生成3D场景
|
8月前
|
存储 人工智能 JSON
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
A2A是谷歌推出的首个标准化智能体交互协议,通过统一通信规范实现不同框架AI智能体的安全协作,支持多模态交互和长时任务管理,已有50多家企业加入生态。
721 0
AI智能体内战终结者!A2A:谷歌开源的首个标准智能体交互协议,让AI用同一种“语言”交流
|
8月前
|
人工智能 自然语言处理 测试技术
谷歌AI 多模态 Gemini 2.5 Pro的国内使用教程
在人工智能(AI)的星辰大海中,谷歌再次投下一枚重磅炸弹 💣!他们倾注心血打造的智慧结晶
3662 0
|
10月前
|
人工智能 芯片 内存技术
谷歌Deepmind的CEO称Deepseek的AI模型是中国“最好的作品”,但炒作“夸大其词”
谷歌Deepmind的CEO称Deepseek的AI模型是中国“最好的作品”,但炒作“夸大其词”
|
10月前
|
人工智能 5G 数据库
D1net阅闻|谷歌被曝正使用Anthropic的Claude模型来改进其Gemini AI
D1net阅闻|谷歌被曝正使用Anthropic的Claude模型来改进其Gemini AI
|
10月前
|
人工智能 监控 Java
谷歌放弃AI武器禁令——这对AI的未来意味着什么
谷歌放弃AI武器禁令——这对AI的未来意味着什么