最擅长玩《毁灭战士》的AI开源了 | 来自CMU的论文&代码

简介:
本文来自AI新媒体量子位(QbitAI)

7ff437f5f1872a38d2af742d9063699e91268912

最擅长玩《毁灭战士(DOOM)》的那个AI,最近开源了。

它叫Arnold,来自卡耐基梅隆大学“终结者队(Terminator)”,在2017年的VizDoom竞赛中以275杀220死0自杀的成绩,拿下了未知地图完整版死斗比赛的冠军。

在比赛中,Arnold能够只根据游戏的画面来判断局势,在一个陌生的3D环境中探索地图、选择武器、击杀敌人。

VizDoom,是基于第一人称射击游戏《毁灭战士》游戏的AI研究平台,主要用在视觉机器学习和深度强化学习的研究上。Viz代表Visual,也就是说,平台上的Agent主要依靠视觉输入来玩游戏。

Arnold参加的VizDoom 2017竞赛,就是在这个平台上举办的。

竞赛以Agent在10场多人死斗中击杀敌人的数量-自杀数来定胜负,分为两个“赛道”:Track 1是已知地图上的限制版死斗,玩家可用的武器只有火箭炮;Track 2是未知地图上的完整版死斗,玩家可以使用各种武器,训练Agent时有5张地图可选,不过在最终比赛时会遇到一张陌生的测试地图。

比赛场面非常血腥热烈,是这样的(视频有点长……):


 Track 2完整视频,时长100分钟

这两个赛道,Arnold都参加了,它在限制版死斗获得了第二名,在完整版死斗中拿下了冠军。

最近开源的,就是Arnold的PyTorch实现。发布在GitHub上的代码包括训练《毁灭战士》Agent所需要的源代码、17张可以用于训练或测试的地图、5个可以可视化出来玩的预训练模型,包括今年夺冠的那个。

Arnold有两位作者:Devendra Singh Chaplot和Guillaume Lample。Chaplot是CMU机器学习系的博士生,师从Ruslan Salakhutdinov,研究深度强化学习及其在机器人和NLP中的应用。Lample 2016年获得了CMU硕士学位,现在是Facebook AI Research的博士生。

e25f89bf2e50582f32a3db8f7f866c15a6df3487

512a1fcecb6c940e1dae2e4d484abf7fe77ee9fe

在VizDoom 2017中和他们竞争的高手们,也不乏大机构背后支持。比如Track 1的第三名Axon,来自腾讯互娱(IEG)的NEXT研发中心;Track 2第二名TSAIL队,来自清华大学,他们给自己的Agent起了个古代人偶工匠的名字:偃师;Track 2第三名则是英特尔是IntelAct。另外,参赛的还有Facebook田渊栋和吴育昕组成的F1队、王乃岩、Siyi Li组成的AlphaDoom队等等。

这些队伍中有不少在2016年就参加过这个竞赛,比如F1,就是VizDoom 2016限制版死斗的冠军,IntelAct是完整版死斗的冠军。CMU终结者队的Arnold,在VizDoom 2016两个赛道上都是第二名。

2016年的竞赛结束后,F1队和终结者队都发表了相关论文,解读自己在比赛中所用的技术,而终结者队最近开源的Arnold代码,与去年的论文仍是一脉相承。

最后,本文相关的代码和论文都在这里啦:

Arnold开源代码:
https://github.com/glample/Arnold

Arnold论文:
https://arxiv.org/abs/1609.05521

田渊栋、吴育昕的论文Training Agent for First-Person Shooter Game with Actor-Critic Curriculum Learning:
https://openreview.net/pdf?id=Hk3mPK5gg

今年还有一支队伍DoomNet也开源了代码:
https://github.com/akolishchak/doom-net-pytorch

VizDoom官网:
http://vizdoom.cs.put.edu.pl/

本文作者:李林 
原文发布时间:2017-12-26
相关文章
|
6月前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
6月前
|
人工智能 IDE Java
AI Coding实践:CodeFuse + prompt 从系分到代码
在蚂蚁国际信贷业务系统建设过程中,技术团队始终面临双重考验:一方面需应对日益加速的需求迭代周期,满足严苛的代码质量规范与金融安全合规要求;另一方面,跨地域研发团队的协同效率与代码标准统一性,在传统开发模式下逐渐显现瓶颈。为突破效率制约、提升交付质量,我们积极探索人工智能辅助代码生成技术(AI Coding)的应用实践。本文基于蚂蚁国际信贷技术团队近期的实际项目经验,梳理AI辅助开发在金融级系统快速迭代场景中的实施要点并分享阶段性实践心得。
1435 25
AI Coding实践:CodeFuse + prompt 从系分到代码
|
6月前
|
人工智能 自然语言处理 安全
氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"
AI兴起催生“氛围编程”——用自然语言生成代码,看似高效实则陷阱。它让人跳过编程基本功,沦为只会提示、不懂原理的“中间商”。真实案例显示,此类项目易崩溃、难维护,安全漏洞频出。AI是技能倍增器,非替代品;真正强大的开发者,永远是那些基础扎实、能独立解决问题的人。
616 11
氛围编程陷阱:为什么AI生成代码正在制造大量"伪开发者"
|
6月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
1048 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
6月前
|
人工智能 机器人 测试技术
AI写的代码为何金玉其外败絮其中
本文分析AI编码看着好看其实很烂的现象、原因,探索行之有效的的解决方案。并从理论上延伸到如何更好的与AI协作的方式上。
249 3
|
6月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
6894 89
|
6月前
|
人工智能 监控 Java
零代码改造 + 全链路追踪!Spring AI 最新可观测性详细解读
Spring AI Alibaba 通过集成 OpenTelemetry 实现可观测性,支持框架原生和无侵入探针两种方式。原生方案依赖 Micrometer 自动埋点,适用于快速接入;无侵入探针基于 LoongSuite 商业版,无需修改代码即可采集标准 OTLP 数据,解决了原生方案扩展性差、调用链易断链等问题。未来将开源无侵入探针方案,整合至 AgentScope Studio,并进一步增强多 Agent 场景下的观测能力。
2564 80
|
6月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
594 5
我们开源了一款 AI 驱动的用户社区
|
6月前
|
人工智能 安全 开发工具
C3仓库AI代码门禁通用实践:基于Qwen3-Coder+RAG的代码评审
本文介绍基于Qwen3-Coder、RAG与Iflow在C3级代码仓库落地LLM代码评审的实践,实现AI辅助人工评审。通过CI流水线自动触发,结合私域知识库与生产代码同仓管理,已成功拦截数十次高危缺陷,显著提升评审效率与质量,具备向各类代码门禁平台复用推广的价值。(239字)
1216 24