中国人工智能学会通讯——从升级版的AlphaGo看未来的强人工智能时代

简介:

image

image

作为最古老的竞技游戏之一,围棋吸引着一批又一批的人类智者,对其进行前赴后继的探索。围棋当中双方的信息完全公开,理论上必然存在一种必胜策略。而掌握这种必胜策略者,就是人们心目中的“围棋上帝”。必胜策略的第一步棋,又被称作为“天元一目”。由于围棋每一步都有着比国际象棋等其他竞技游戏更多的走法,导致寻求围棋最佳走法不可避免地陷入组合爆炸的局面。因此,无论是人类,还是当前的计算机都无法找到必胜策略。正是如此,围棋这种必胜策略深深地隐藏于广阔的未知之中,吸引了一批又一批智者在不断追寻。

随着互联网的普及和围棋培训体系的完善,现代围棋选手的水平已经远超过了古代棋手。即便如此,一位著名的日本棋手说过,如果“围棋上帝”存在的话,那么现代顶尖棋手与“围棋上帝”仍存在让二子的巨大差距。“围棋上帝”一直存在于棋手们的想象当中,成为棋手们毕生追求的目标。AlphaGo 的升级版本 Master 这一次重新出现在公众视野面前,以 60 战全胜的战绩横扫了现役职业顶尖高手,包括柯洁 / 井山裕太 / 朴廷桓这三位中日韩现役
第一人。从这 60 盘棋来看,Master 已充分展现了自己在计算上的优势,而职业棋手们对局后也都纷纷表示跟目前这位“Master”差距太大。柯洁在自己的微博上写下了这样一段话:“人类数千年的实战演练进化,计算机却告诉我们人类全是错的。我觉得,甚至没有一个人沾到围棋真理的边。但是我想说,从现在开始,我们棋手将会结合计算机,迈进全新的领域达到全新的境界。”可见,目前升级版的 AlphaGo 是最接近职业棋手想象中的“围棋上帝”,让人们真正感受到了“上帝视角”。

image

根据之前在 Nature 上发表的 AlphaGo的论文来看,AlphaGo 并没有采用暴力搜索的方式来寻找最优方案,而是采用经过大量棋局训练的策略神经网络和价值神经网络来搜索胜率最大的走法。也就是说,如果 AlphaGo 真的是“围棋上帝”,它通过启发式搜索的方式找到或者逼近了必胜策略。这似乎预示出一个令人振奋的事实:深度神经网络有可能找到任何公开信息问题的最优解!果真如此,这是否意味着深度神经网络可以解决人类智慧能够解决的很多问题,甚至远远超过人类。无独有偶,最近 Google 在另一个人工智能项目中,利用深度神经网络来识别唇语,其正确率远超过人类唇语专家。其实,以 DeepMind 为代表的人工智能正在向更多的领域渗透,人工智能的广泛应用直接催生了人类社会的第四次工业革命。

当然,深度神经网络的研究依然任重道远。虽然,各种新设计的深度神经网络不断地刷新了机器学习的水平,但还没有人能从理论上完美解释其隐含的机理。当前,对深度神经网络有比较深刻的理论分析的研究工作,当属 NIPS 最新发表的一篇论文,论证了线性神经元的深度神经网络在求解最优化问题上的理论正确性。而目前经常用到的 CNN(卷积神经网络)和 RNN(循环神经网络)等都远比线性神经元要复杂。同时,深度神经网络由于需要大量的训练样本的植入,在训练过程中需要不断地调整参数,来获得想要的输出。比如,AlphaGo 的监督式学习训练出来的策略网络,就需要人类的棋局作为训练样本,而且训练过程中也需要人工设定特征参数。在这样的情况下,神经网络与世界之间的对应关系,仍然是人为设定,而不是神经网络自主生成的。此外,深度神经网络还不具有逻辑推演的能力,而是搞超大规模
的训练数据来拟合真实场景。以 AlphaGo为例,AlphaGo通过学习了几千万局的对弈,并对这些局面进行统计分析,然后才达到了目前的棋力。但人类顶尖棋手通常要达到同等程度的棋力,只需要下几千盘棋,不到 AlphaGo 的万分之一。因此,AlphaGo的学习效率仍然十分低下,这说明,它仍然没有触及到人类智能中最本质的部分。也就是说,目前的神经网络还不具有推演的能力,不像人类能够从少量的案例中学习到现象背后的内在规律,并且将规律推广到更多的场景当中。举个通俗的例子,我们常说聪明的人学什么都很快,也就是说人类可以将不同问题上的经验迁移到新的问题上,但是目前看来,深度神经网络还不具备这样的能力。

当前机器学习界的另一个流派——概率图流派,或许更符合人类的思维习惯。它将内在逻辑利用概率关系设计到模型当中,然后利用少量的数据就能训练出可以拟合大量场景的模型。譬如,Nature 的一篇论文就是利用概率图模型模仿人类书法,并通过图灵测试。不过,当前深度神经网络实在太过热门,导致了概率图流派一直没有得到充足的媒体曝光。不过可以想象,未来的强人工智能很有可能是二者的有机融合。虽然目前相关研究寥寥无几,但是其中蕴含的可能性还是非常值得我们期待的。

“围棋上帝”Master 的出现,表面看起来是机器的胜利,其实背后隐藏着人类
的智慧,说到底还是人类的胜利。期待通过人类科学家的不断努力探索,强人工智能时代尽早到来。

image

北京工业大学教授,博士生导师,长江学者特聘教授,国家杰出青年基金获得者。中国人工智能学会常务理事、科普工作委员会主任。长期从事神经网络结构分析与自组织设计、计算智能与智能优化控制等研究工作,在智能特征建模、自组织控制和多目标动态优化方面取得了系列创新性成果。

相关文章
|
3月前
|
人工智能 安全 Anolis
中兴通讯分论坛邀您探讨 AI 时代下 OS 的安全能力 | 2024 龙蜥大会
操作系统如何提供符合场景要求的安全能力,构建更加安全可信的计算环境。
|
3月前
|
机器人 C# 人工智能
智能升级:WPF与人工智能的跨界合作——手把手教你集成聊天机器人,打造互动新体验与个性化服务
【8月更文挑战第31天】聊天机器人已成为现代应用的重要组成部分,提供即时响应、个性化服务及全天候支持。随着AI技术的发展,聊天机器人的功能日益强大,不仅能进行简单问答,还能实现复杂对话管理和情感分析。本文通过具体案例分析,展示了如何在WPF应用中集成聊天机器人,并通过示例代码详细说明其实现过程。使用Microsoft的Bot Framework可以轻松创建并配置聊天机器人,增强应用互动性和用户体验。首先,需在Bot Framework门户中创建机器人项目并编写逻辑。然后,在WPF应用中添加聊天界面,实现与机器人的交互。
86 0
|
4月前
|
人工智能 搜索推荐 vr&ar
苹果手机iOS18最新升级:植入AI人工智能,国内百度文心一言,国外GPT4o来辅助
iOS 18亮点速览:AI强化的Siri、RCS安卓消息兼容、自定义主屏、辅助功能增强,VR进步,新隐私工具,包括锁定APP和眼动追踪。Passwords app保障安全,Apple Intelligence提升个性化体验。
201 1
|
机器学习/深度学习 人工智能 自然语言处理
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
第五届世界互联网大会正在如火如荼的举行。
搜狗翻宝Pro机再次开挂,智能翻译硬件成中国人工智能的新风口
|
机器学习/深度学习 人工智能 自然语言处理
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
这是ShowMeAI每周通讯的第3期。本期内容关键词:新冠、ChatGPT、2022 AI 报告、腾讯·绝悟、阿里·AliceMind、小红书·全站智投、OpenAI·Point-E、Google·CALM、Wayve·MILE、AI2·MemPrompt、Stanford x MosaicML·PubMed GPT、腾讯全员大会、特斯拉裁员、图森未来裁员、AI 应用与工具大全。
543 0
阳过→阳康,数据里的时代侧影;谷歌慌了!看各公司如何应对ChatGPT;两份优质AI年报;本周技术高光时刻 | ShowMeAI每周通讯 #003-12.24
|
人工智能
|
人工智能
《人工智能赋能电商服务升级》电子版地址
人工智能赋能电商服务升级(ppt)
214 0
《人工智能赋能电商服务升级》电子版地址
|
人工智能 自动驾驶 算法
人工智能赋能智慧城市智能化升级
人工智能在城市智能化中发挥着关键作用。许多城市开始在其治理中采用智慧城市的概念。这涉及数据收集和处理,以通过实验和创新帮助改善城市和提高效率。
214 0
人工智能赋能智慧城市智能化升级
|
机器学习/深度学习 人工智能 定位技术
举出其他监督学习,无监督学习,强化学习的例子?说一下非显著式编程的优势?AlphaGo的胜利,带给我们什么样的人生启示?当代大学生如何在人工智能时代增加自己的核心竞争力?
举出其他监督学习,无监督学习,强化学习的例子?说一下非显著式编程的优势?AlphaGo的胜利,带给我们什么样的人生启示?当代大学生如何在人工智能时代增加自己的核心竞争力? 监督学习:比如手写体识别,我们将许多汉字的手写数字图像数据作为训练数据。汉字的数据的分类目标被称作标签和类。训练数据有一个标签(某一个汉字),根据标签可以找到关于手写数字图像的正确答案信息,例如“此手写数字图像为‘人’”。在学习阶段,当将手写汉字图像输入系统时,调整系统的参数以尽量将输入图像分类为正确的标签,最后进行识别输出正确结果。 无
209 0
|
机器学习/深度学习 人工智能 自然语言处理
与世界同行 2017中国人工智能大会有感
与世界同行 2017中国人工智能大会有感
2078 0
与世界同行 2017中国人工智能大会有感

热门文章

最新文章