Unity拥抱AI:用机器学习训练NPC、机器人、模拟自动驾驶

简介:

在李世石和柯洁战败后,人类在棋类竞技场已经难与AI争锋。很多人会说,作为非职业棋类选手,不在乎下不下的赢棋。想一想,要是以后打游戏也赢不了AI了……

这件事情已经发生了,且还在加速。雷锋网曾报道,2017年9月,Open AI的DotA 2游戏人工智能在1V1中击败了人类玩家。

同年9月,全球最大的3D游戏引擎Unity宣布发布Unity Machine Learning Agents(ML-Agents),一款提供给游戏开发者的开源AI工具包。Unity这一开源工具包是Unity将机器学习应用在游戏的成果,AI已经附能各行各业,那么在游戏行业,会带来哪些有趣的成果?

Unity拥抱AI:用机器学习训练NPC、机器人、模拟自动驾驶

5月11-13日,Unite Beijing 2018在国家会议中心召开。Unity AI与机器学习副总裁Danny Lange分享了ML-Agents的新进展,雷锋网也来到了现场。

ML-Agents助力游戏开发

Lange介绍到,机器学习对于游戏开发来说很重要,能够让游戏开发过程更加简单,让游戏变得更加有吸引力,开发者可以不用每一个方案都编程,游戏与玩家的互动变化可以让系统自己学习。就像人从环境当中感知,并作出反应一样。ML-Agents可以以相同的方式来训练这些系统。

Lange给大家演示了一个Demo,未来主义的赛车游戏,Demo中左边是人类,然后右边是机器学习的Agent。一开始的时候,Agent转弯不好,容易装车,但是它慢慢学习人类的操作,大概25分钟的训练之后,你可以看到可能还是有点不稳,但是不会再撞车了。经过不断的训练,Agent能编程非常好的选手。

那么,具体游戏场景中,可以有以下应用:机器学习可以应用在几个方面。第一个是创建NPC,有多种行为的NPC, NPC已经学习了很多人类行为,这会让与人类的交互更为自然。第二个是游戏本身。AI能够为优化玩家的乐趣进行学习,而不是为开发者的乐趣而进行优化。对于玩家来说,会有更多个性化和定制化的东西。第三个是一个完全不同的领域,就是我们用机器学习在游戏发布前测试游戏。确保使用agent代替人类玩家进行游戏时,你能够了解游戏是否能顺利进行。

此外,在游戏中如果人类玩家数量很少,就可以用agent代替人类玩家。最后一个方面是match making。使用机器学习可以将合适的玩家找出来,匹配在一起玩游戏。可以让机器学习系统了解如何优化游戏时间、为玩家配对以及如何最大化利用游戏时间。

Unity拥抱AI:用机器学习训练NPC、机器人、模拟自动驾驶

(由Unity创建的一个网球游戏RL/ML模拟训练环境示例)

ML-Agents训练自动驾驶、机器人

从两年多前,Unity就开始酝酿转型,从一家纯引擎提供商转向互联网+云增值服务。Danny Lange是Unity发力AI领域的背后推手,在加入Unity之前,Lange曾担任Uber机器学习负责人,在更早之前,Lange还负责过亚马逊和微软的机器学习产品研发。

除了游戏以外,ML-Agents在自动驾驶和机器人领域还有很多应用场景。Lange介绍到,自动驾驶是ML-Agents很大的应用领域,因为这样就不需要像Uber那样在真实的路上驾驶,用机器学习模拟就可以避免在真实道路测试带来的事故。另外一个领域是机器人,用增强型学习,你可以在虚拟环境去训练机器人,可以很快地完成几十万或者几百万次训练。训练好的模型可以放到真实的机器人上面应用。

此外,ML-Agents也可以应用在建筑设计中,比如要如何合理设计通道、人流,用机器学习的方式去模拟建筑内的路线图。


原文发布时间为:2018-05-22

本文作者:李诗

本文来自云栖社区合作伙伴“雷锋网”,了解相关信息可以关注“雷锋网”。

相关文章
|
10月前
|
机器学习/深度学习 人工智能 JSON
【解决方案】DistilQwen2.5-R1蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式的机器学习和深度学习平台,对DistilQwen2.5-R1模型系列提供了全面的技术支持。无论是开发者还是企业客户,都可以通过 PAI-ModelGallery 轻松实现 Qwen2.5 系列模型的训练、评测、压缩和快速部署。本文详细介绍在 PAI 平台使用 DistilQwen2.5-R1 蒸馏模型的全链路最佳实践。
|
9月前
|
人工智能 JSON 算法
【解决方案】DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen 系列是阿里云人工智能平台 PAI 推出的蒸馏语言模型系列,包括 DistilQwen2、DistilQwen2.5、DistilQwen2.5-R1 等。本文详细介绍DistilQwen2.5-DS3-0324蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践。
|
6月前
|
机器学习/深度学习 自然语言处理 算法
Java 大视界 -- Java 大数据机器学习模型在自然语言处理中的对抗训练与鲁棒性提升(205)
本文探讨Java大数据与机器学习在自然语言处理中的对抗训练与鲁棒性提升,分析对抗攻击原理,结合Java技术构建对抗样本、优化训练策略,并通过智能客服等案例展示实际应用效果。
|
人工智能 调度 芯片
PAI训练服务:云上大模型训练新篇章
本文介绍了通用AI时代下的新训练方法及PAI平台的优化。随着大模型时代的到来,算力需求激增,硬件和网络通信成为瓶颈。PAI平台通过自动容错、3D健康检测等技术确保训练稳定性;通过资源配额、智能调度等提高性价比;并推出PAI-TorchAcc和PAI-ChatLearn两大引擎,分别实现高效训练加速和灵活的对齐训练,显著提升训练性能与效果。这些改进解决了大规模AI训练中的关键问题,提升了效率和稳定性。
|
11月前
|
人工智能 自然语言处理 算法
MT-MegatronLM:国产训练框架逆袭!三合一并行+FP8黑科技,大模型训练效率暴涨200%
MT-MegatronLM 是摩尔线程推出的面向全功能 GPU 的开源混合并行训练框架,支持多种模型架构和高效混合并行训练,显著提升 GPU 集群的算力利用率。
846 18
|
人工智能 自动驾驶 安全
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
Cosmos 是英伟达推出的生成式世界基础模型平台,旨在加速物理人工智能系统的发展,特别是在自动驾驶和机器人领域。
1135 15
Cosmos:英伟达生成式世界基础模型平台,加速自动驾驶与机器人开发
|
11月前
|
机器学习/深度学习 人工智能 边缘计算
DistilQwen2.5蒸馏小模型在PAI-ModelGallery的训练、评测、压缩及部署实践
DistilQwen2.5 是阿里云人工智能平台 PAI 推出的全新蒸馏大语言模型系列。通过黑盒化和白盒化蒸馏结合的自研蒸馏链路,DistilQwen2.5各个尺寸的模型在多个基准测试数据集上比原始 Qwen2.5 模型有明显效果提升。这一系列模型在移动设备、边缘计算等资源受限的环境中具有更高的性能,在较小参数规模下,显著降低了所需的计算资源和推理时长。阿里云的人工智能平台 PAI,作为一站式的机器学习和深度学习平台,对 DistilQwen2.5 模型系列提供了全面的技术支持。本文详细介绍在 PAI 平台使用 DistilQwen2.5 蒸馏小模型的全链路最佳实践。
|
人工智能 JSON 算法
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
阿里云的人工智能平台 PAI,作为一站式、 AI Native 的大模型与 AIGC 工程平台,为开发者和企业客户提供了 Qwen2.5-Coder 系列模型的全链路最佳实践。本文以Qwen2.5-Coder-32B为例,详细介绍在 PAI-QuickStart 完成 Qwen2.5-Coder 的训练、评测和快速部署。
Qwen2.5-Coder 系列模型在 PAI-QuickStart 的训练、评测、压缩及部署实践
|
机器学习/深度学习 人工智能
Diff-Instruct:指导任意生成模型训练的通用框架,无需额外训练数据即可提升生成质量
Diff-Instruct 是一种从预训练扩散模型中迁移知识的通用框架,通过最小化积分Kullback-Leibler散度,指导其他生成模型的训练,提升生成性能。
348 11
Diff-Instruct:指导任意生成模型训练的通用框架,无需额外训练数据即可提升生成质量
|
人工智能 JSON 算法
魔搭支持在阿里云人工智能平台PAI上进行模型训练、部署了!
现在,魔搭上的众多模型支持在阿里云人工智能平台PAI-Model Gallery上使用阿里云算力资源进行模型训练和部署啦!
867 22