Nature封面:大脑里装了4亿篇新闻,能与人类自主辩论的最强AI辩手来了!

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: IBM最强AI辩手Project Debater代表了当前「计算辩论」研究的顶点。在充斥着海量信息和误导文化的当下,我们期待实现完全自主辩论的AI系统能够促进智能辩论的发展,帮助建立更合理的论点,做出更明智的决策。

微信图片_20220112235513.jpg


 新智元报道  

来源:nature等编辑:LQ,PY

【新智元导读】IBM最强AI辩手Project Debater代表了当前「计算辩论」研究的顶点。在充斥着海量信息和误导文化的当下,我们期待实现完全自主辩论的AI系统能够促进智能辩论的发展,帮助建立更合理的论点,做出更明智的决策。


 对于辩论的研究可以追溯到古希腊,当时古希腊哲学家如苏格拉底等人在市集上与人们讨论政治,辩论真理,辩论内容包罗万象。


微信图片_20220112235516.png


苏格拉底之死

当下的人工智能研究一大挑战就是「如何让机器理解自然语言辩论中的论点」。


微信图片_20220112235519.png  


人工智能专家Noam Slonim 

近日,IBM研究院研究员、希伯来大学人工智能专家Noam Slonim和团队公布了相关研究Project Debater的进展,该系统通过扫描储存了4亿篇新闻报道和维基百科页面的档案库,自行组织开场白和反驳论点。


虽然最终仍然输给了人类辩手,但此次AI辩手的表现提供了一种可能:未来人工智能可以帮助人类制定并理解复杂的论点。


微信图片_20220112235522.png 


自然语言处理 (NLP)算法 NLP是指计算机自动理解、解读和处理人类语言(比如,话语和文本)。

 

NLP 是人机互动的关键要素, IBM Project Debater 团队积极开展 NLP研究也在情理之中。

微信图片_20220112235525.png


2018年,IBM研究院则在美国旧金山的Watson West,首次展示了人类与智能机器之间的公开现场辩论赛。双方辩手分别是IBM耗时逾六年研发的,首个能与人类进行复杂辩论的AI系统Project Debater(以下简称Debater),以及以色列国际辩论协会主席 Dan Zafrir.

 

该研究强调了在技术发展过程中,在辩论中识别、产生和反驳论点的过程中,将不同组成部分结合起来的强大工程的重要性,每个组成部分处理一个特定的任务。

 

大概10年前,对人类话语进行分析,以确定引用证据来支持结论的方式——这个过程现在被称为「论点分析」,这明显超出了最先进的人工智能的能力范围。

 

从那时起,人工智能技术的进步和论证技术工程的日益成熟,再加上激烈的商业需求,该领域迅速扩张。全世界有超过50个实验室在研究这个问题,包括所有大型软件公司的团队。

 

这一领域研究激增的原因是人工智能系统的直接应用能够识别大量文本中语言使用的统计规律,这种应用在人工智能的许多应用中起到了变革性的作用,但在论点挖掘方面还没有达到这样的进展。

 

因为论点结构太多样化、太复杂、太微妙、太隐晦,不像句子结构那样容易被识别。

因此,Slonim等人决定发起一项重大挑战: 开发一个「完全」可以与人类进行现场辩论的自主系统。Project Debater代表了这项工作的顶峰。

 

Project Debater关键技术点

 

立场分类和情绪分析自动辩论系统必须能够确定论点能否支持或反驳给定的主题。

这对人类来说十分简单,但对机器而言则相当困难,因为它需要能够敏锐地辨别自然语言丰富的微妙之处和细微差异。

 

深度神经网络 (DNN)和弱监督DNN具备提高自动语言理解能力的巨大潜力,但是众所周知,训练DNN需要大量人工标记的高质量数据。

 

该团队开发了多种工具和方法,以弱监督式训练DNN,来缓解这个瓶颈问题。

 

他们还利用DNN开发Project Debater的听说技能 。

 

文本转语音(TTS)系统与个人助手或导航器不同,辩论系统需要能够持续数分钟对事先未知的主题作出雄辩,同时与受众保持互动。

 

科研团队开发了新的TTS算法和方法,用于为Project Debater提供清晰流利、有说服力的语言表达能力。

 

Project Debater难以达到人类辩手的连贯性和流畅性


在论证技术的发展以及将论证作为局部现象来处理的过程中,Project Debater是一个关键的步骤。

 

它的成功提供了一个新视角,我们可以了解人工智能系统是如何利用人类能够轻易提出来的论点组成的网络来进行工作的。

 

几乎所有的人工智能研究都把目标定得很高,但瓶颈在于是否能够获取足够的数据,计算出有效的解决方案来应对既定挑战。

Project Debater采用双管齐下的办法克服这一障碍: 它将重点缩小到100多个辩论专题; 从巨量的数据集中收集原始材料,。

 

在2018年和2019年的一系列比赛中,Project Debater挑战了多个才华横溢、备受瞩目的人类辩手,比如曾在2016年获得以色列国家辩论冠军以色列大四女生Noa Ovadia ,观众对其表现进行了非正式的评估。

 


image.png 


该系统以其辩论技术为后盾,并以经过处理的数据集为支撑,创建了一个4分钟的演讲,开启了一场关于其全部技能中某个主题的辩论,一个人类对手会对此作出回应。

然后,它对对手的观点做出反驳,发表第二次4分钟的演讲。对方用4分钟反驳回答,辩论结束时,双方参与者都做了2分钟的闭幕陈述。

 

Project Debater最薄弱的一点是,它难以模仿人类辩手的连贯性和流畅性ーー这个问题与其处理能力的最高水平有关,在这个水平上,它可以选择、抽象和编排论点。

 

然而,这种限制并不是Project Debater所独有的。尽管进行了两千年的研究,人们对「论证结构」仍然知之甚少。

根据论证研究的重点是否集中在语言使用、认识论、认知过程还是逻辑有效性,人们对于连贯论证和推理模型所提出的关键特征各不相同。

 

所有论证技术系统面临的最后一个挑战是,将论证视为受一系列孤立因素影响的本地论述碎片,还是将它们编入更大规模的社会范围的辩论。在很大程度上,这是设计要解决的问题,而不是设计解决方案。

 

通过给论证设定先验界限,理论上的简化变得可行,从而提供了主要的计算优势。例如,识别「主要要求」就成为一个明确的任务,机器几乎可以像人类一样可靠地完成这项任务。问题在于人类根本不擅长这项任务,恰恰因为它是人工设计的。

在公开讨论中,一段给定的论述可能是一个上下文中的主张,另一个上下文中的前提。

 

此外,在现实世界中,没有明确的界限来划定一个论点:发生在辩论室之外的话语并不是离散的,而是与交叉引用、类比、例证和概括的网络相连接。

 

关于人工智能如何处理这种论证网的想法已经有相关理论在讨论,并利用软件来实现,例如,一个名为DebateGraph的系统是一个互联网平台,它提供了计算工具,用于可视化和分享复杂的、相互关联的思想网络。

 

然而,与这些实施相关的理论挑战和社会技术问题是艰巨的:设计令人信服的方法来吸引大量受众进入这种系统,与设计简单明了的机制使他们能够与这些复杂的辩论网络互动一样困难。

 

在论证技术的发展以及将论证作为局部现象来处理的过程中,Project Debater是一个关键的步骤。

 

它的成功提供了一个诱人的机会,让我们了解人工智能系统是如何与人类能够轻松自如解释的论点网络一起工作的。

 

现在假新闻充斥,公众舆论两极分化,松散的推理无处不在,这些都掩盖了人类在创造、处理、导航和分享复杂论点方面的迫切需求,而在这方面,人工智能或许能够提供支持。

因此,尽管Project Debater解决了一个重大的挑战,代表了人工智能进步,可以促进人类的推理,而且,正如Slonim等人所说,Project Debater拓宽了当前人工智能技术的舒适区,未来将能够参与更加复杂的人类活动。

 

参考资料:

https://www.nature.com/articles/d41586-021-00539-5

论文: https://www.nature.com/articles/s41586-021-03215-w

https://m.thepaper.cn/yidian_promDetail.jsp?contid=8191132&from=yidian

相关文章
|
20天前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
20 1
|
24天前
|
机器学习/深度学习 人工智能 算法
Nature子刊:AI模型测大脑年龄,究竟哪些因素会加速大脑衰老?
【10月更文挑战第7天】《自然医学》杂志近期发布了一项研究,介绍了一种名为BrainAge的人工智能模型,该模型可预测个体的大脑年龄并分析影响大脑衰老的因素。研究团队来自美国加州大学旧金山分校,利用英国生物银行的近50,000名参与者的数据,发现高血压、糖尿病、肥胖、吸烟、饮酒、缺乏运动及遗传因素均与大脑衰老有关。尽管存在数据集限制等局限性,BrainAge模型仍为研究大脑衰老和相关疾病提供了重要工具。
40 1
|
3月前
|
数据采集 人工智能
Nature封面:AI训练AI,越训越离谱
【8月更文挑战第16天】新发表于《自然》杂志的论文显示,当AI模型基于其他AI生成的数据训练时,会出现“模型崩溃”现象,即模型逐渐遗忘真实数据分布细节,偏向生成更常见模式而非罕见模式。这一研究由牛津、剑桥等高校合作完成,通过实验验证了不同AI模型均可能出现此问题,尤其是在低质或少量数据训练下更为显著。但通过数据增强或模型正则化可缓解该现象。研究强调了训练数据质量和来源的重要性,并引发了关于AI发展和应用的讨论。
198 58
|
2月前
|
机器学习/深度学习 人工智能 TensorFlow
神经网络深度剖析:Python带你潜入AI大脑,揭秘智能背后的秘密神经元
【9月更文挑战第12天】在当今科技飞速发展的时代,人工智能(AI)已深入我们的生活,从智能助手到自动驾驶,从医疗诊断到金融分析,其力量无处不在。这一切的核心是神经网络。本文将带领您搭乘Python的航船,深入AI的大脑,揭秘智能背后的秘密神经元。通过构建神经网络模型,我们可以模拟并学习复杂的数据模式。以下是一个使用Python和TensorFlow搭建的基本神经网络示例,用于解决简单的分类问题。
47 10
|
2月前
|
人工智能 数据处理
Nature:AI让抄袭问题更加复杂,科学家该如何应对?
【9月更文挑战第16天】《自然》杂志一篇文章指出,AI在科研领域的应用日益增长,带来了加速数据处理、提升计算效率等益处,同时也引发了对科学标准、数据偏见及研究诚信的挑战。一项针对1600多名研究人员的调查显示,超半数认为未来十年AI将成为其研究领域不可或缺的工具。AI能够显著提升科研效率,但也可能增加对模式识别的依赖,加剧数据偏见,并引发研究不可重复性等问题。尤其是大型语言模型如ChatGPT,虽有助于改进论文语法和翻译,但也可能传播错误信息。此外,部分科学家面临计算资源和高质量数据不足等使用障碍。
37 3
|
2月前
|
人工智能 开发者
Nature曝惊人内幕:论文被天价卖出喂AI!出版商狂赚上亿,作者0收入
【9月更文挑战第8天】《自然》杂志近日揭露,学术出版商如泰勒·弗朗西斯与微软签订千万美元合约,及威利获高额报酬,将论文提供给科技巨头训练AI模型,引发学界对版权与收益分配的热议。此现象反映了AI对高质量数据的渴求,但亦使研究人员担忧成果被无偿商用,且可能影响学术独立性。尽管AI训练使用学术资源能提升模型科学性,助力科研进展,但如何保障作者权益及维持学术纯粹性仍是亟待解决的问题。https://www.nature.com/articles/d41586-024-02599-9
48 4
|
2月前
|
机器学习/深度学习 人工智能 算法
首个像人类一样思考的网络!Nature子刊:AI模拟人类感知决策
【9月更文挑战第8天】近日,《自然》子刊发表的一篇关于RTNet神经网络的论文引起广泛关注。RTNet能模拟人类感知决策思维,其表现与人类相近,在反应时间和准确率上表现出色。这项研究证明了神经网络可模拟人类思维方式,为人工智能发展带来新启示。尽管存在争议,如是否真正理解人类思维机制以及潜在的伦理问题,但RTNet为人工智能技术突破及理解人类思维机制提供了新途径。论文详细内容见《自然》官网。
53 3
|
4天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
37 8
|
3天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
24 2
|
3天前
|
人工智能 搜索推荐 安全
AI技术在医疗领域的应用与挑战
【10月更文挑战第27天】 本文探讨了人工智能(AI)在医疗领域的应用,包括疾病诊断、药物研发和患者管理等方面。同时,也分析了AI在医疗领域面临的挑战,如数据隐私、伦理问题和技术局限性等。通过对这些方面的深入分析,我们可以更好地理解AI在医疗领域的潜力和发展方向。
93 59

热门文章

最新文章