一周AI最火论文 | 使用图形界面就能搭建的强化学习模型

简介: 一周AI最火论文 | 使用图形界面就能搭建的强化学习模型

本周关键词:自动驾驶、强化学习、GANs

本周最佳学术研究

Waymo开放数据集挑战赛

今年3月,Alphabet旗下的自动驾驶公司Waymo发起公开挑战赛,参赛者可以使用其自动驾驶数据集(包括2D和3D检测、2D和3D跟踪以及域适应数据)来建立和测试机器学习模型。挑战赛收到来自世界各地的上百份代码提交,最终入围决赛的选手来自中国、英国、新加坡、美国等多个国家。

最近公开的Waymo开放数据集(Waymo Open Dataset,WOD)是用于自动驾驶研究的大型数据集,提供了1000个用于训练和验证以及150个用于测试的驾驶片段。每个片段包含拍摄自不同摄像机的镜头,平均每部摄像机约200帧图像,这其中还包括5台分辨率为1280×1920或886×1920的高分辨率摄像机。总而言之,该数据集包含约115万张关于车辆、行人和骑自行车的人的图像,以及990万张2D边界框。

本论文给出了Waymo开放数据集(WOD)2020挑战赛的最佳解决方案。作者采用FPN(Feature pyramid networks)作为基本框架,而级联RCNN、堆叠PAFPN(Path aggregation FPN)和多头RCNN则用于提高性能。为了处理WOD中的小目标检测问题,训练和测试都使用了超大尺寸的图像,本文的方案在2D对象检测跟踪中排名第一。作者们计划持续增加数据集,希望这将有助于国际研究界在机器感知和自动驾驶技术方面取得进步。

原文:
https://arxiv.org/abs/2008.01365v1

MusPy - 用于生成符号音乐的工具包

本文介绍了MusPy,一个用于生成符号音乐的开源Python库。MusPy为音乐生成系统中的基本组件提供了易于使用的工具,包括数据集管理,数据I / O,数据预处理和模型评估等。

为了展示模型能力,作者对MusPy当前支持的11个数据集进行了统计分析。此外,他们还进行了跨数据集的泛化实验,通过在每个数据集上训练自回归模型,测量其他数据集上的留存可能性(MusPy的数据集管理系统使此过程变得更加容易)。

源码及文档:
https://github.com/salu133445/muspy
原文:
https://arxiv.org/abs/2008.01951v1

深度轻量级Transformer模型

在本论文中,Facebook人工智能实验室和艾伦人工智能研究所的研究人员提出了一种名为DeLighT的极深度轻量级Transformer模型。他们认为,与其他基于Transformer的模型相比,DeLighT可以提供类似或更好的性能,并且参数要少得多。

DeLighT可以高效地分配参数,它使用DExTra(一种深度轻量级转换)在每个Transformer编码器层中分配参数,而在各层之间使用逐层缩放的方法,这种方法允许在输入附近使用较浅较窄的DeLighT层,在输出附近使用较宽较深的DeLighT层。

总体而言,DeLighT网络的深度可以是标准Transformer模型的2.5至4倍,但参数和操作却少得多。在机器翻译和语言建模任务上进行的实验表明,DeLighT可以用更少的参数达到Transformer基线模型的性能。

源码:
https://github.com/sacmehta/delight
原文:
https://arxiv.org/abs/2008.00623v1

一个新型、简单并且可扩展性高的强化学习框架

强化学习(RL)已成为当下主流之一的研究领域,前沿的人工智能公司都会将其作为重要工具来对待。因此,许多研究人员建立了RL框架,例如openAI Gym和KerasRL,以简化其他人的使用。

为了降低RL新手的入门障碍,本文提出了一个新框架——EasyRL。EasyRL是一个通过交互式GUI来构建、训练和评估RL代理的框架。

由于EasyRL完全以GUI呈现,因此不需要有关于训练或测试其内置RL代理的编程知识。该框架还支持自定义RL代理和环境,这对于RL研究人员评估和比较其RL模型非常有帮助。

原文:
https://arxiv.org/abs/2008.01700v1

用于图像和视频合成的GANs:算法与应用

GANs现在是执行各种图像和视频合成任务的强大工具。它们能生成高分辨率的逼真图像和视频,而在此之前这是一项艰巨甚至不可能的任务。GANs还能在内容创作中生成一些新内容。

在这项工作中,研究人员提供了GANs的概述,着重于视觉合成的算法和应用。它们涵盖了稳定GANs训练的几种重要技术,尤其是一些臭名昭著的技术难点。他们还讨论了其在图像翻译,图像处理,视频合成和神经渲染中的应用。

原文:
https://arxiv.org/abs/2008.02793v1

其他爆款论文

简单的Modulo可以大大胜过基于深度学习的代码:
https://arxiv.org/abs/2008.01686v1

一种用于有效标记的主动图像合成方法,可提高使用小数据进行学习任务时的性能:
https://arxiv.org/abs/1902.01522v4

引入Cylinder3D进行驾驶场景LiDAR语义分割:
https://arxiv.org/abs/2008.01550v1

单个示例生成连贯的层级样式:
https://arxiv.org/abs/2008.01531v1

学习资源

机器学习简单的自学资源:
https://developers.google.com/machine-learning/crash-course

吴恩达讲授斯坦福机器学习课程:
http://www.holehouse.org/mlclass/?fbclid=IwAR1XmS0CtIXUDg0s2bxeTUpiv2Dh08L_DaDQqA2HCXqafUFfcWays6S07UI

AI大事件

AI可能会创造的20种严重犯罪:
https://www.zdnet.com/article/evil-ai-these-are-the-20-most-dangerous-crimes-that-artificial-intelligence-will-create/

Julia 1.5发布:
https://www.zdnet.com/article/programming-language-julia-version-1-5-is-out-lots-of-new-features-better-performance/

相关文章
|
4月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
2092 120
|
4月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
891 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
4月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
501 120
|
5月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
404 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
865 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
5月前
|
人工智能 负载均衡 API
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
大家好,我是Immerse,独立开发者、AGI实践者。分享编程、AI干货、开源项目与个人思考。关注公众号“沉浸式趣谈”,获取独家内容。Vercel新推出的AI Gateway,统一多模型API,支持自动切换、负载均衡与零加价调用,让AI开发更高效稳定。一行代码切换模型,告别接口烦恼!
654 1
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
|
机器学习/深度学习 人工智能 算法
AI学习笔记——强化学习之Model-Free Prediction--解决未知环境下的预测问题
前面关于强化学习的文章中介绍了MDP,动态规划的方法对MDP问题的V函数进行评估和求最优策略。然而现实问题中,往往很多时候环境是未知的。那么这篇文章就介绍一下在未知环境下用Model Free的方法预测MDP。
2081 0
|
机器学习/深度学习 人工智能 算法
AI学习笔记——强化学习之动态规划(Dynamic Programming)解决MDP(2)
求解最优MDP实际上就是找到最佳策略(Policy)π来最大化来最大化V函数(Value Function)。 公式一 1. 策略估算(Policy Evaluation) 在MDP问题中,如何评估一个策略的好坏呢?那我们就计算这个策略的V函数(值函数),这里我们又要用到之前文章中提到的Bellman Equation了。
1285 0