DeepMind让AI系统拥有记忆,教机器学习系统举一反三打游戏

简介:
本文来自AI新媒体量子位(QbitAI)

机器学习系统现在适用于很多类型的任务,但它们也有一个共同的问题:学得不一定快,但忘得很快。

比如说,DeepMind训练神经网络玩雅达利游戏时,给系统输入Space Invaders的训练数据,它就学会了玩Space Invaders;再输入打砖块的训练数据,它就学会了打砖块,却忘了Space Invaders该怎么玩。

最近,DeepMind和伦敦帝国理工学院的研究人员已经创建了一种算法,允许该系统的神经网络自主学习,保留信息,并再次使用它。

相关论文发表在《美国国家科学院院刊(PNAS)》,摘要地址:

http://www.pnas.org/content/early/2017/03/13/1611835114.abstract

全文PDF:
http://www.pnas.org/content/early/2017/03/13/1611835114.full.pdf

以下是对DeepMind这项新进展的介绍,
来源:新浪科技 ID:techsina

人工智能(AI)系统能够学会一款雅达利(Atari)游戏,然后利用这些知识再学习另一款游戏。

2014年当DeepMind的机器学习系统学会玩雅达利游戏时,突然引人瞩目地跃入公众视线。这套系统可以把游戏打通关,得分比人类还高,但却不记得它是怎样做到的。

该系统玩每一款雅达利游戏时,都要单独创建一组神经网络,因此,如果不能同时为人工智能输入《空间入侵者》(Space Invaders)和《打砖块》(Breakout)的信息,就不能在同一个系统上玩这两款游戏。现在,一组DeepMind和伦敦帝国理工学院的研究人员已经创建了一种算法,允许该系统的神经网络自主学习,保留信息,并再次使用它。

“以前我们有一个系统可以学着玩任何游戏,但它一次只能学会玩一款游戏,“DeepMind的研究科学家詹姆斯·基尔克帕特里克(James Kirkpatrick)说,他是该系统最新研究论文的主笔。“在此我们展示了一个系统,可以一个接一个地学习玩几个游戏。”

这篇论文发表在美国国家科学院学报上,解释了DeepMind的AI系统如何运用有监督学习和强化学习测试等方式来不断学习。该公司的博客文章也对此做了说明。

计算机科学家在论文中写道:“不断完成学习任务而不遗忘的能力是生物和人工智能的核心组成部分。”基尔克帕特里克说,如今,神经网络和人工智能中的“重大缺陷”已无法从一个任务传递到下一个任务。

研究小组表示,已经能够在“突触整合”的基础上展示“持续学习”,在人脑中,这个过程被描述为“学习和记忆的基础”。

为了让AI系统拥有记忆,DeepMind研究人员开发了一种名为“弹性权重固化”(EWC)的算法。论文指出,“我们的方法是通过有选择性地减慢高权重任务的学习速度来记住旧的任务。”基尔克帕特里克解释说,该算法可以选择在游戏中成功通关的做法,并把最有用的部分保留下来。

“我们只允许它们(在游戏间)非常缓慢地做出改变,”他说,“如此一来,我们就有了学习新任务的空间,但是我们所进行的改变不会覆盖我们以前学过的东西。”

为了对算法进行测试,DeepMind采用了深度神经网络,它被称为Deep Q网络(DQN),以前曾被用来征服雅达利游戏。然而,这一次DQN使用的是“增强的”EWC算法。研究人员随机选择了十款雅达利游戏来测试算法和神经网络,AI的表现足以与人类玩家相媲美。每款游戏被玩过2000万次之后,系统自动切换到下一款雅达利游戏。

“以前,DQN不得不单独学习如何玩一款游戏,”文章写道。“DQN在EWC的助力下功能大增,可以不再经历灾难性的遗忘过程,连续不断地学会玩很多游戏。”

从本质上讲,使用EWC算法的深度神经网络能够学习玩一个游戏,然后将已学会的知识加以转换,再去玩下一个全新的游戏。

然而,这套系统还不完美。虽然它能够学习以前的经验,并保留最有用的信息,但它的神经网络无法像只完成一个游戏那样运转良好。

“当下,我们已经证明了AI系统能够不断学习,但我们还无法证明它的学习效率有所提高,”基尔克帕特里克说。“下一步我们将利用和规范连续学习,尝试和改善它在现实世界的学习活动。”(斯眉)

原文发布时间:2017-03-15
相关文章
|
9天前
|
存储 人工智能 运维
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
100 47
【01】做一个精美的打飞机小游戏,浅尝阿里云通义灵码python小游戏开发AI编程-之飞机大战小游戏上手实践-优雅草央千澈-用ai开发小游戏尝试-分享源代码和游戏包
|
13天前
|
人工智能 自然语言处理 安全
通过阿里云Milvus与PAI搭建高效的检索增强对话系统
阿里云向量检索Milvus版是一款全托管的云服务,兼容开源Milvus并支持无缝迁移。它提供大规模AI向量数据的相似性检索服务,具备易用性、可用性、安全性和低成本等优势,适用于多模态搜索、检索增强生成(RAG)、搜索推荐、内容风险识别等场景。用户可通过PAI平台部署RAG系统,创建和配置Milvus实例,并利用Attu工具进行可视化操作,快速开发和部署应用。使用前需确保Milvus实例和PAI在相同地域,并完成相关配置与开通服务。
|
16天前
|
存储 人工智能 大数据
AI开发新范式,PAI模型构建平台升级发布
本次分享由阿里云智能集团产品专家高慧玲主讲,聚焦AI开发新范式及PAI模型构建平台的升级。分享分为四个部分,围绕“人人可用”和“面向生产”两大核心理念展开。通过降低AI工程化门槛、提供一站式全链路服务,PAI平台致力于帮助企业和开发者更高效地实现AI应用。案例展示中,介绍了多模态模型微调在文旅场景的应用,展示了如何快速复现并利用AI解决实际问题。最终目标是让AI技术更普及,赋能各行业,推动社会进步。
|
10天前
|
人工智能 自然语言处理 调度
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
Casevo 是中国传媒大学推出的开源社会传播模拟系统,结合大语言模型和多智能体技术,支持复杂社会网络建模与动态交互,适用于新闻传播、社会计算等领域。
71 22
Casevo:开源的社会传播模拟系统,基于 AI 模拟人类认知、决策和社会交互,预测社会传播现象
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
AigcPanel:开源的 AI 虚拟数字人系统,一键安装开箱即用,支持视频合成、声音合成和声音克隆
AigcPanel 是一款开源的 AI 虚拟数字人系统,支持视频合成、声音克隆等功能,适用于影视制作、虚拟主播、教育培训等多种场景。
143 12
AigcPanel:开源的 AI 虚拟数字人系统,一键安装开箱即用,支持视频合成、声音合成和声音克隆
|
1天前
|
人工智能 自然语言处理 数据可视化
校企合作|TsingtaoAI携手潍坊学院,共建AI驱动的党建信息化系统
TsingtaoAI与潍坊学院近日达成合作,正式签署《人工智能党建信息化系统开发》技术开发合同,计划在未来两年内联合开发一套集党员教育、党务管理、党建活动智能化以及数据可视化于一体的智能党建系统。本次合作将充分结合TsingtaoAI在AI大模型领域的技术优势和潍坊学院的学术资源,为推动党建工作的数字化、智能化和高效化注入新的动力。
25 10
|
15天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
64 23
|
2天前
|
SQL 人工智能 关系型数据库
AI时代下的PolarDB:In-DB一体化模型训练与推理服务
本次分享主题为“AI时代下的PolarDB:In-DB一体化模型训练与推理服务”,由阿里云资深专家贾新华和合思信息刘桐炯主讲。内容涵盖PolarDB的关键能力、AI硬件与软件结构支持、典型应用场景(MLops、ChatBI、智能搜索),以及合思实践案例——AI对话机器人提升客户响应效率。通过简化流程、SQL统一管理及内置算法,PolarDB显著降低了AI应用门槛,并在多个行业实现最佳实践。
|
16天前
|
人工智能 容灾 Serverless
AI推理新纪元,PAI全球化模型推理服务的创新与实践
本次分享主题为“AI推理新纪元,PAI全球化模型推理服务的创新与实践”,由阿里云高级产品经理李林杨主讲。内容涵盖生成式AI时代推理服务的变化与挑战、play IM核心引擎的优势及ES专属网关的应用。通过LM智能路由、多模态异步生成等技术,PAI平台实现了30%以上的成本降低和显著性能提升,确保全球客户的业务稳定运行并支持异地容灾,目前已覆盖16个地域,拥有10万张显卡的推理集群。
|
16天前
|
人工智能 运维 API
PAI企业级能力升级:应用系统构建、高效资源管理、AI治理
PAI平台针对企业用户在AI应用中的复杂需求,提供了全面的企业级能力。涵盖权限管理、资源分配、任务调度与资产管理等模块,确保高效利用AI资源。通过API和SDK支持定制化开发,满足不同企业的特殊需求。典型案例中,某顶尖高校基于PAI构建了融合AI与HPC的科研计算平台,实现了作业、运营及运维三大中心的高效管理,成功服务于校内外多个场景。

热门文章

最新文章