7 Papers & Radios | MIT造出薄如纸的音响;腾讯「绝艺」打麻将战胜人类冠军(2)

简介: 7 Papers & Radios | MIT造出薄如纸的音响;腾讯「绝艺」打麻将战胜人类冠军

论文 6:BOAT: Bilateral Local Attention Vision Transformer


摘要:在这项研究中,来自百度研究院和香港大学的研究者重新思考了局部自注意力机制,提出了特征空间局部注意力(feature-space local attention 或简称 FSLA)。这种局部注意力从图像内容出发,把特征相似的 token 聚成类,并且只在每类特征的内部计算自注意力,相比全局自注意力显著降低了计算量,同时基本保留了原始的全局自注意力机制对远距离特征依赖的建模能力。

为了将特征空间局部注意力与图像空间局部注意力相结合,本文作者进一步提出了双边局部注意力 ViT (简称 BOAT),把特征空间局部注意力模块加入到现有的基于窗口的局部注意力视觉 Transformer 模型中,作为图像空间局部注意力的补充,大大提升了针对远距离特征依赖的建模能力,在几个基准数据集上的大量实验表明结合了特征空间局部注意力的模型明显优于现有的 ConvNet 和 ViT 模型。

BOAT 架构示意图。

BLA 快架构图。

算法 1:平衡二进制聚类。

推荐:引入特征空间,显著降低计算量:双边局部注意力 ViT 性能媲美全局注意力。

论文 7:Too Afraid to Drive: Systematic Discovery of Semantic DoS Vulnerability in Autonomous Driving Planning under Physical-World Attacks


摘要:如今,高等级自动驾驶(AD)车辆,即在大多数情况下可以在没有人类驾驶员的情况下自动驾驶的车辆,已经公开上路。一些公司,如 Waymo、百度、GM Cruise,也已经在提供没有安全驾驶员公共服务。在大规模部署之前,了解此类系统中可能存在的安全风险非常重要。典型的自动驾驶系统具有传感、规划和控制步骤。传感步骤使用不同的传感器(例如,相机、激光雷达、GPS)来了解周围环境。规划步骤根据周围环境生成驾驶轨迹。规划将为自动驾驶车辆做出关键任务决策,例如避免碰撞、变道。控制步骤将为车辆生成控制命令,使其可以完成计划的轨迹。
先前的工作研究了在各种物理世界攻击下感知的安全风险,例如传感器欺骗或设计具有恶意外观、纹理或形状的对象。在这项工作中,我们完成了第一个特定于规划的安全分析。我们想研究攻击者是否可以通过简单地以正常方式改变周围环境(例如在另一条车道上驾驶另一辆车,或将常见物体放置在车道外)来将规划决策变为意想不到的决策

自动驾驶规划语义 DoS 漏洞的问题定义。

Planfuzz 系统设计总览。

Autoware.AI 车道行驶的语义 DoS 漏洞以及可能带来的追尾。

推荐:畏首畏尾的自动驾驶安全风险:自动驾驶规划中语义 DoS 漏洞系统化分析。
ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括NLP、CV、ML领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:


10 NLP Papers音频:00:0019:14

本周 10 篇 NLP 精选论文是:


1. Efficient Training of Neural Transducer for Speech Recognition.  (from Hermann Ney)2. On the Effect of Pretraining Corpora on In-context Learning by a Large-scale Language Model.  (from Kyunghyun Cho)3. ICDBigBird: A Contextual Embedding Model for ICD Code Classification.  (from George Michalopoulos)4. $G^2$: Enhance Knowledge Grounded Dialogue via Ground Graph.  (from Yang Gao)5. Embedding Knowledge for Document Summarization: A Survey.  (from Jian Yang, Xindong Wu)6. Query2Particles: Knowledge Graph Reasoning with Particle Embeddings.  (from Hongming Zhang)7. Persona-Guided Planning for Controlling the Protagonist's Persona in Story Generation.  (from Minlie Huang)8. Why does Self-Supervised Learning for Speech Recognition Benefit Speaker Recognition?.  (from Jian Wu)9. UBERT: A Novel Language Model for Synonymy Prediction at Scale in the UMLS Metathesaurus.  (from Srinivasan Parthasarathy)10. A Thorough Examination on Zero-shot Dense Retrieval.  (from Ji-Rong Wen)

相关文章
|
关系型数据库 MySQL 开发工具
windows编译poco c++库
windows编译poco c++库
|
分布式计算 Ubuntu Hadoop
【Linux】在ubuntu18.04系统中配置网络信息(超有用,完美解决,只看这一篇就行了)
【Linux】在ubuntu18.04系统中配置网络信息(超有用,完美解决,只看这一篇就行了)
2392 0
|
人工智能 自然语言处理 数据可视化
《当传统遇上AI:Tableau与PowerBI的华丽转身》
在数据可视化与分析领域,Tableau和PowerBI长期占据重要地位。随着AI技术的融入,这两款工具实现了全方位升级,极大提升了用户体验。 Tableau新增自然语言交互、智能洞察挖掘和可视化智能推荐功能,降低了数据分析门槛,帮助用户轻松发现隐藏规律并高效制作图表。PowerBI则通过DAX公式智能编写、移动端智能交互和报表智能订阅等功能,简化了复杂计算,实现了随时随地的数据洞察。两者共同开启了数据处理的新时代,为企业决策提供有力支持。
480 12
|
11月前
|
机器学习/深度学习 人工智能 自然语言处理
GPT-4o mini:开启人工智能新篇章
GPT-4o mini为AI开发者带来了新的机遇与挑战。深入理解其理论基础,有效运用于实践,不断提升个人能力,借助团队合作的力量,开发者可以驾驭这一AI模型,推动技术发展,开启智能科技的新篇章。在AI技术不断演进的今天,持续学习与创新是成为行业先锋的关键。
|
存储 缓存 NoSQL
【Go语言专栏】Go语言中的Redis操作与缓存应用
【4月更文挑战第30天】本文探讨了在Go语言中使用Redis进行操作和缓存应用的方法。文章介绍了Redis作为高性能键值存储系统,用于提升应用性能。推荐使用`go-redis/redis`库,示例代码展示了连接、设置、获取和删除键值对的基本操作。文章还详细阐述了缓存应用的步骤及常见缓存策略,包括缓存穿透、缓存击穿和缓存雪崩的解决方案。利用Redis和合适策略可有效优化应用性能。
354 0
【微信公众平台对接】有关【上传图文消息内的图片获取URL】调用示例
【微信公众平台对接】有关【上传图文消息内的图片获取URL】调用示例
462 0
|
安全 API C#
C# 如何让程序后台进程不被Windows任务管理器强制结束
C# 如何让程序后台进程不被Windows任务管理器强制结束
724 0
|
IDE Java 开发工具
python缩进错误(IndentationError)
【7月更文挑战第12天】
2868 10
|
应用服务中间件 nginx 数据安全/隐私保护
nginx配置源IP访问控制
nginx配置源IP访问控制
263 0
|
机器学习/深度学习 人工智能 文字识别
【学习打卡03】可解释机器学习笔记之CAM类激活热力图
【学习打卡03】可解释机器学习笔记之CAM类激活热力图