盘点丨DeepMind 2017年工作回顾:从AlphaGo Zero到Parallel WaveNet

简介: 今天DeepMind官方博客发布文章-DeepMind's work in 2017: A Year In Review 。过去一年,从AlphGo到WaveNet,DeepMind取得了一系列重大研究成果,成为AI领域的大明星。

引言

今年7月,世界排名第一的围棋选手柯洁在连胜20场比赛后发表讲话。这距离上次他在中国乌镇未来围棋峰会上与AlphaGo对弈已有两个月。他表示:“ 在与AlphaGo比赛之后,我彻底反思并重新思考了这次比赛,现在我可以看到这样的反思对我有很大的帮助。我也希望所有的棋手能够去思考AlphaGo下棋的思想和技法,这些都是很有意义的。虽然是输了,但我发现围棋的变化确实太大了,它还在不停的进步,我也希望自己能不断的进步,在自己的顶峰时期多待几年。”

fd0b8ec4c6bb4ac780e755e4a2111d4332e769b9

图1,未来围棋峰会是一个为期5天的盛会,它有各式各样的比赛形式,包括两人对弈,团队对弈以及与柯洁1对1对弈。

柯洁可以说是围棋领域大师级的人物,听到他的上述发言使我们倍感荣幸。其实我们也受到柯洁的启发,他的这些感想暗示未来社会可以使用AI作为发现探索的工具,发现新知识,增加人们对世界的理解。特别是在机器辅助科学方面,我们希望人工智能系统能够帮助人们在应对气候变化和药物发现方面取得进展,或者能够寻找到复杂的新型材料以及帮助缓解医疗系统的压力。这种潜在的社会效益便是我们建立DeepMind的初衷,我们很高兴在应对基础科学挑战以及AI安全和伦理方面取得了持续的进展。

我们在DeepMind上所采用的方法受到神经科学的启发,旨在帮助人们在一些关键领域(如想象力,推理,记忆和学习)取得进展。以想象力为例:这种人类独有的能力在我们的日常生活中起着至关重要的作用,它使我们能够规划和推理未来,但这种能力对计算机来说却是极具挑战性的。我们以后将继续努力解决这个难题,今年引入了imagination-augmented agents(想象增强代理),它可以从环境中提取相关信息来帮助规划未来的工作

我们训练了一个神经网络来演示如何自动地控制模拟环境中的各种简化身体,这种方法受神经科学启发,也是我们工作中最受欢迎的演示之一。这种复杂的运动控制是人体智能的标志,也是我们研究计划的重要组成部分。虽然由此产生的动作有时候是狂野的,有时是笨拙的,但也取得了惊人的成功,而且还可以用于娱乐观赏。

4b33c78a4f7f56c04f579c03e809e3693fd69317

图2,DeepMind运动控制示意图,链接:https://www.youtube.com/watch?v=gn4nRCC9TwQ

“我们知道技术不是价值中立的。我们不能在基础研究方面取得进展的同时,而不对我们技术的伦理和社会影响负责。”

此外,我们在生成模型领域也取得了进展。就在一年前,我们提出了WaveNet,这是一个产生原始音频波深度神经网络,它能够产生比现有的技术更好的且更逼真的模拟语音。那个时候,这个模型还是一个研究原型,而且直接用在消费产品中计算复杂度又太高。在过去的12个月里,我们的团队创造了一个新模型,将WaveNet的训练速度提高了1000倍。在10月份,我们发布了这个新的并行WaveNet(Parallel WaveNet)。现在我们已经将它部署在实际应用中,在谷歌助手(Google Assistant)中生成英语和日语的声音。

WaveNet的改进只是我们竭力使AI系统的构建、训练和优化变得更容易的其中一例。今年我们发布的其他技术,如分布式强化学习、基于总体的神经网络训练、新的神经结构搜索方法,同样使系统更容易构建、更精确和更快地优化。我们同时花了大量的时间创造新的、具有挑战性的环境来测试我们的算法,这其中就包括我们与暴雪合作开发“星际争霸2”。

我们知道技术不是价值中立的。我们不能在基础研究方面取得进展的同时,而不对我们技术的伦理和社会影响负责。这推动了我们在一些关键领域的研究,比如在深度学习的可解释性方面,我们一直在探索新的方法来理解和解释我们的系统。我们的团队也致力于开发切实可行的方法,来确保我们在享受未来科技带来的便利同时保持这些系统始终在人类有效地控制范围之内,这就是为什么我们有一个成熟的技术安全团队的原因。

95b15b394756e3119b57fd5f192585115c4160bf

图3,我们现在已经与四家NHS信托基金合作。

在十月份,我们又推出了DeepMind Ethics&Society这个研究项目,用以帮助我们探索和理解AI的实际影响,从而实现更大的社会效益。我们的研究受到了来自多个领域著名专家的指导,如哲学家Nick Bostrom、气候变化专家Christiana Figueres、研究员James Manyika以及经济学家Diane Coyle和Jeffrey Sachs。

人工智能发展必须切合社会的需求和关注点,这就是为什么我们要与许多合作伙伴开展关于如何设计和部署人工智能的合作。例如,领导算法正义联盟(Algorithmic Justice League)的Joy Buolamwini以及来自人权组织Article 36的专家和英国武装部队的专家,参加了Wired Live的会议,并讨论算法的偏见和限制致命自动化武器使用的问题。正如我们经常说的那样,这些问题太重要了,而且影响极为深远。

这也是为什么我们也需要和更多的领域开展合作来讨论如何预测和指导技术的发展方向,这些合作领域可以来自AI公司内部也可以是非AI公司。其中一个例子是我们今年共同主持的人工智能伙伴关系(Partnership on AI),它召集行业竞争对手、学术界和民间团体共同讨论AI的伦理问题。在过去的一年里,PAI已经迎来了43个新的非营利和已营利组织,以及一个新的执行董事Terah Lyons。在接下来的几个月里,我们期待与这个小组合作,研究广泛的主题,包括算法中的偏见和歧视、机器学习对自动化和劳动力的影响等。

“我们对我们在2017年的所有成果感到自豪,但我们深知DeepMind还有很长的路要走。”

我们深信利用技术来实现社会效益的重要性,并且技术在影响现实生活中健康和能源方面等方面仍然有着巨大的潜力。今年,我们同意与NHS医院信托建立新的合作关系,以部署我们的Streams应用程序,该应用程序支持NHS临床医生使用数字技术,去确定机器学习技术是否有助于提高乳腺癌的检测,这也是我们参与的研究机构联盟发起了一项开创性研究。

同时,我们也一直致力于监管在健康方面工作。信息专员在研究我们与Royal Free最初的合作中,取得了一些成果。DeepMind Health的独立评论人发表了第一份关于我们工作的公开年度报告,我们也从这些报告里总结了一些经验教训。他们的审查使我们以后的工作做的更好。我们已经在我们与患者和公众的交流上做了重大的改进,包括与病人和照顾者的研讨会,并且我们也在探索在我们的系统中建立可信度的技术方法,例如可验证的数据审计技术,我们计划将其作为一个开源工具发布。

我们对我们2017年的所有进展感到自豪,但知道还有很长的路要走。

在乌镇AlphaGo与柯洁对战并从竞赛中退役了AlphaGo 的五个月后,发表了我们的第四篇Nature论文,论文关于名为AlphaGo Zero的新版本系统,这个版本不需要任何先验知识。在数百万游戏的过程中,系统逐渐从头开始学习“围棋”游戏,短短几天就积累了数千年的关于围棋对战的知识。这样做也揭示了非常规策略,并且揭示了我们从围棋这个古老游戏中的获得的启发。

我们的信念是:人工智能作为一项科学工具和人类智慧的增效器可以在为其他更为复杂问题领域发挥更大的作用。AlphaGo团队已经在准备迎接下一个重大的挑战,同时我们希望AlphaGo团队借助围棋获得的算法上启发仅仅只是开始。


原文发布时间为:2017-12-26

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”微信公众号

相关文章
|
8月前
|
SQL 数据可视化 关系型数据库
Quick BI 测评报告
Quick BI是阿里云推出的零代码可视化分析工具,适合个人开发者与小微团队使用。其核心优势在于轻量化启动(免费试用+按量付费)、多源接入(MySQL、MongoDB等)及敏捷分析能力(拖拽式仪表板)。实测显示,它支持智能CSV解析、语法高亮SQL编辑器和25+基础图表类型,具备图表联动交互功能。尽管缺少3D地图和自定义JS插件支持,但凭借低学习成本、OpenAPI扩展性以及移动端报表查看功能,Quick BI在个人项目展示、团队协作和轻量级数据分析中表现出色。不过,复杂计算需依赖SQL,移动端编辑和PDF导出存在局限性。
444 3
|
9月前
|
应用服务中间件 Linux 开发者
用的到linux-tomcat端口占用排查-Day5
通过本文的介绍,详细讲解了在CentOS 8系统上排查和解决Tomcat端口占用问题的方法。从使用 `netstat`、`lsof`和 `ss`命令检查端口占用情况,到使用 `ps`和 `top`命令查找和停止占用端口的进程,再到修改Tomcat端口配置,最后介绍了自动化脚本的方法。希望本文能帮助系统管理员和开发者有效地解决端口占用问题,确保Tomcat服务器的正常运行。
316 11
|
9月前
|
人工智能 自动驾驶 算法
人工智能引发的新文明冲击:未来十年消失的职业!
在21世纪科技浪潮中,人工智能(AI)正以前所未有的速度改变生活方式和工作模式。未来十年内,预计30种传统职业如流水线工人、仓库拣货员、收银员等将逐渐消失,带来前所未有的挑战与机遇。本文探讨这一趋势,分析受影响的职业,并讨论人类如何在AI时代找到新定位。通过GAI认证提升技能,把握AI时代的机遇,共创辉煌未来。
|
8月前
|
人工智能 算法
要创新,怎少得了智能体?新鲜出炉的TRIZ发明原则AI助手,你不来试试?
TRIZ发明原则AI助手是一款专注于技术创新领域的智能工具,由法思诺创新团队开发。它结合了TRIZ理论中的矛盾矩阵和发明原则,旨在帮助用户聚焦具体技术问题并快速生成大量有针对性的创意解决方案。相比通用AI,该助手在专业性、准确性和实用性上更具优势,尤其适合解决技术和产品研发中的复杂问题。通过将常规问题转化为TRIZ句型、匹配工程参数、查询矛盾矩阵及提供创意思路,助手实现了从问题定义到解决方案的全流程支持。尽管仍存在一些局限性(如偶尔输出不稳定或不够专业),但通过与研发人员的协作,其潜力可得到最大化发挥。目前,团队邀请用户试用并反馈,以持续优化这一创新工具。
416 0
|
Prometheus 监控 数据可视化
Grafana 插件生态系统:扩展你的监控能力
【8月更文第29天】Grafana 是一个流行的开源平台,用于创建和共享统计数据的仪表板和可视化。除了内置的支持,Grafana 还有一个强大的插件生态系统,允许用户通过安装插件来扩展其功能。本文将介绍一些 Grafana 社区提供的插件,并探讨它们如何增强仪表盘的功能性。
1038 3
|
11月前
|
弹性计算 监控 安全
助力企业高效构建安全、可观测的云上数据中心
本次课程聚焦于助力企业高效构建安全、可观测的云上数据中心,涵盖三大方面:1) 数据中心网络面临的挑战,包括VPC、NAT网关和私网连接等产品的功能与挑战;2) 数据中心网络产品重磅发布,涉及安全设计建议、容灾能力提升及深度可观测能力的增强;3) 用户体验升级,通过VPC IPAM实现高效的网络地址管理和简化的产品体验。整体旨在为企业提供更安全、稳定、高效的云上解决方案。
|
存储 关系型数据库 数据挖掘
通义灵码与亚马逊 AWS 的融合之道
本文介绍了通义灵码与亚马逊AWS的深度融合,通过生成部署代码及与AWS服务的集成,如EC2实例创建、RDS数据库配置、S3存储设置和Lambda服务集成等,极大提升了开发者的开发效率和应用的智能化水平。总结部分强调了这一融合为开发者带来的技术助力,推动了应用开发向更高效、智能的方向发展。
通义灵码与亚马逊 AWS 的融合之道
|
搜索推荐 数据挖掘 API
抖音商品详情API接口对电商的作用及收益
在电商快速发展的背景下,抖音作为全球领先的短视频平台,凭借其庞大的用户基础和高活跃度,通过商品详情API接口为电商行业开辟了新渠道。本文深入解析了抖音商品详情API接口的功能及其对电商的积极作用,包括商品信息实时同步、提升用户体验、精准营销、数据分析与优化等方面,展示了该接口如何帮助电商企业拓展销售渠道、优化商品策略、提升用户满意度、促进跨界合作与开发创新商业模式,为电商企业带来显著收益。同时,文章也探讨了实现这些收益的关键步骤及面临的挑战,强调了数据安全与隐私保护的重要性,以及创新和差异化竞争的必要性。
394 4
|
SQL 关系型数据库 数据管理
在 Postgres 中使用 Delete Join
【8月更文挑战第11天】
641 0
在 Postgres 中使用 Delete Join