7 Papers & Radios | Bengio等用GFlowNets统一生成模型;首个黑箱防御框架

简介: 7 Papers & Radios | Bengio等用GFlowNets统一生成模型;首个黑箱防御框架

本周主要论文包括Bengio 等人用 GFlowNets 统一生成模型;清华 & Meta 提出 HorNet,用递归门控卷积进行高阶空间相互作用


目录

  1. Unifying Generative Models with GFlowNets
  2. Transformers in Remote Sensing: A Survey
  3. Efficient Methods for Natural Language Processing: A Survey
  4. Interactive Disentanglement: Learning Concepts by Interacting with their Prototype Representations
  5. MM-RealSR: Metric Learning based Interactive Modulation for Real-World Super-Resolution
  6. HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions
  7. How to Robustify Black-Box ML Models? A Zeroth-Order Optimization Perspective
  8. ArXiv Weekly Radiostation:NLP、CV、ML 更多精选论文(附音频)


论文 1:Unifying Generative Models with GFlowNets


摘要:生成流网络(GFlowNets)是图灵奖得主 Yoshua Bengio 对 AI 领域未来方向提出的想法。灵感来源于信息在时序差分 RL 方法中的传播方式,两者都依赖于 credit assignment 一致性原则,它们只有在训练收敛时才能实现渐近。由于状态空间中的路径数量呈指数级增长,因此实现梯度的精确计算比较困难,因此,这两种方法都依赖于不同组件之间的局部一致性和一个训练目标,即如果所有学习的组件相互之间都是局部一致性的,那么我们就得到了一个系统,该系统可以进行全局估计。现在,Bengio 及其学生张鼎怀等发表了一篇新论文,简要介绍了现有深度生成模型与 GFlowNet 框架之间的联系,阐明了它们的重叠特征,并通过马尔可夫轨迹学习的视角提供了一个统一的观点,并进一步提供了一种统一训练和推理算法的方法。推荐:用 GFlowNets 统一生成模型,Bengio 等人数页论文给讲通了。论文 2:Transformers in Remote Sensing: A Survey


摘要:这篇综述论文涵盖了 60 多种最近基于 Transformer 的方法,用于解决遥感子领域中不同的遥感问题,包括超高分辨率 (VHR)、高光谱 (HSI) 和合成孔径雷达 (SAR) 图像。

最近遥感成像领域基于 Transformer 的技术概览。推荐:内容详实,方法全面,对于想要了解该领域的读者来说值得阅读。论文 3:Efficient Methods for Natural Language Processing: A Survey


摘要:这项综述论文涵盖了 NLP 高效方法的发现与实现,旨在指导该领域的新研究人员并激发新方法开发灵感。

高效 NLP 方法汇总。推荐:本文根据传统的 NLP pipeline 组织了现有文献,并对现有提高效率的方法及其缺点进行了广泛的概述。论文 4:Interactive Disentanglement: Learning Concepts by Interacting with their Prototype Representations


摘要:本文旨在通过弱监督和人机互动在原型离散的潜在空间上学习视觉概念。本文提出交互式概念交换网络(interactive Concept Swapping Networks, iCSNs),这是一个通过弱监督和隐性原型表征来学习以概念为基础的表征的新框架。这种以语义为基础的、离散的潜在空间有利于人类理解和人机互动。

交互式概念交换网络。

推荐:通过基于概念解释进行交互,被 CVPR 2022 会议接收。论文 5:MM-RealSR: Metric Learning based Interactive Modulation for Real-World Super-Resolution


摘要:最近无监督的对比学习在底层视觉领域受到越来越多的关注。这类方法方便了复杂降质特征的提取,这给来自腾讯 ARC Lab 的研究者们提供了一个思路: 是否可以利用对比的方式无监督的构建现实场景下图像超分辨率的可调节交互机制?这篇工作的核心是利用度量学习在高阶仿真退化中,通过对比不同样本退化强度大小的方式无监督地构建退化强度的度量空间。度量空间中的退化得分不代表真实的退化强度,但可以反映退化强度的相对大小。本篇文章提出的方法(MM-RealSR)通过度量空间中的退化得分来构建现实场景下图像超分辨率的可调节交互机制。文章已被 ECCV 2022 会议接收。

本文提出方案与现有方法的对比。推荐:可调节的真实场景图像超分辨率, 腾讯 ARC Lab 利用度量学习来解决。论文 6:HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

摘要:视觉 Transformer 的最新进展表明,在基于点积自注意力的新空间建模机制驱动的各种任务中取得了巨大成功。在本文中,来自清华大学和 Meta AI 的研究者证明了视觉 Transformer 背后的关键成分,即输入自适应、长程和高阶空间交互,也可以通过基于卷积的框架有效实现。作者提出了递归门卷积(),它用门卷积和递归设计进行高阶空间交互。新操作具有高度灵活性和可定制性,与卷积的各种变体兼容,并将自注意力中的二阶交互扩展到任意阶,而不引入显著的额外计算。

HorNet 基本构建块概览。


推荐:清华 & Meta 提出 HorNet,用递归门控卷积进行高阶空间相互作用。论文 7:How to Robustify Black-Box ML Models? A Zeroth-Order Optimization Perspective


摘要:这里介绍一篇密歇根州立大学 (Michigan State University) 和 MIT-IBM AI 实验室的一篇关于黑箱防御工作的文章,本文被 ICLR 2022 接收为 spotlight paper, 代码和模型均已开源。


ZO-AE-DS 的模型架构。推荐:MSU 联合 MIT-IBM 提出首个黑箱防御框架。

相关文章
|
前端开发
前端切图:自制简易音乐播放器
前端切图:自制简易音乐播放器
175 0
|
11月前
|
存储 安全 iOS开发
内存卡怎么格式化?6个格式化方法供你选
随着使用时间的增加,内存卡可能会因为数据积累、兼容性或是文件系统损坏等原因需要进行格式化。那么怎样正确格式化内存卡呢?格式化内存卡的时候需要注意什么呢?本文会给大家提供详细的步骤,帮助大家轻松完成格式化内存卡的操作。
|
8月前
|
文字识别 网络协议 开发工具
GitHub封锁?推荐5个国产的Git仓库替代平台
近日,GitHub对中国区IP的部分限制引发了广泛关注。未登录用户被拒,已登录用户功能受限,南北网络环境差异更显“内卷”。为应对这一挑战,本文推荐了多个国产Git平台:Gitee(码云)、GitCode(CSDN旗下)、CODING(腾讯系)、CodeUP(阿里云支持)及微信代码管理工具。这些平台功能全面、稳定性强,是开发者迁移项目的理想选择。通过同步代码、配置CI/CD流水线等简单步骤,可确保项目平稳过渡。此次事件提醒我们,掌握核心技能与支持国产平台同样重要!
6105 11
|
传感器 安全 大数据
|
监控 网络协议 iOS开发
程序退到后台的时候,所有线程被挂起,系统回收所有的socket资源问题及解决方案
程序退到后台的时候,所有线程被挂起,系统回收所有的socket资源问题及解决方案
578 0
|
弹性计算
云服务器宽带下载速度峰值及公网宽带价格表
阿里云ECS云服务器公网宽带下载速度如何计算?云吞铺子分享ECS云服务器公网宽带实际下载速度及公网宽带收费标准价格表: 阿里云服务器宽带下载速度峰值表 阿里云1M宽带下载速度多少?阿里云1M宽带慢不慢?阿里云10M宽带下载速度快不快?很多用户以为1M宽带下载速度就是1M/秒(实际上是128KB/S.
1822 0
|
数据安全/隐私保护
阿里云点播,微信小程序对接阿里云视频点播
网上也有对于阿里云如何在微信小程序里使用,但是很不全,包括阿里云文档的最佳实践里。话不多说上代码了。upvideo(){ var aliOssParams = util.aliOssParams();//主要是获取上传阿里云的加密策略policy和签名signature;以及上传自己要上传到阿里云的地址,当然还有自己阿里云accessid。