7 Papers & Radios | ACL 2022最佳&杰出论文;谷歌3D扫描家用物品数据集(2)

简介: 7 Papers & Radios | ACL 2022最佳&杰出论文;谷歌3D扫描家用物品数据集

论文 3:Evaluating Factuality in Text Simplification


摘要:自动简化模型旨在使输入文本更具可读性,但此类模型会在自动简化的文本中引入错误。因此,德克萨斯大学奥斯汀分校、东北大学的研究者提出了一种错误分类法,用来分析从标准简化数据集和 SOTA 模型输出中提出的参考资料。

三种类型的信息错误的示例。

手动评估的系统输出中的 SARI 和错误分布。

训练集中的注释标签计数和测试集上的 F1 分数。

推荐:ACL 2022 杰出论文之一。

论文 4:Learning to Generalize to More: Continuous Semantic Augmentation for Neural Machine Translation


摘要:监督神经机器翻译(NMT)的主要任务是学习生成以来自一组并行句子对的源输入为条件的目标句子,从而得到一个能够泛化到未见过实例的模型。然而,通常观察到模型的泛化性能很大程度上受训练中使用的并行数据量的影响。
阿里达摩院、中科院信息工程研究所、中国科学院大学的研究者提出了一种新的数据增强范式,称之为连续语义增强(CsaNMT),它为每个训练实例增加了一个邻接语义区域。

CSANMT 框架。

算法 1:MGRC 采样。

WMT14 En→De 和 En→Fr 任务上的 BLEU 分数。

推荐:ACL 2022 杰出论文之一。

论文 5:PP-YOLOE: An evolved version of YOLO


摘要:百度飞桨团队发布了 PP-YOLOE,与其他 YOLO 系列算法相比,其具有更强的性能、更丰富灵活的配置方案以及更全硬件支持三大优势。

PP-YOLOE 各尺寸模型性能与其他模型对比示意图。

PP-YOLOE 模型结构示意图。


RepResBlock 和 CSPRepResStage 结构示意图。

推荐:YOLO 界再起波澜!mAP 51.4,149FPS,目标检测,一个就够了。

论文 6:Google Scanned Objects: A High-Quality Dataset of 3D Scanned Household Items


摘要:谷歌的研究者提出了 Google Scanned Objects (GSO) 数据集,这是一个由超过 1000 个 3D 扫描的家用物品组成的精选集,可用于 Ignition Gazebo、Bullet 模拟器和其他可以读取 SDF 模型格式的工具。

谷歌 GSO 的自定义 3D 扫描流程。

选取的 3D 模型数据集非常适合做仿真。

扫描校准过程。

推荐:谷歌公布 13GB 3D 扫描数据集:17 大类、1030 个家用物品。

论文 7:Ditch the Gold Standard: Re-evaluating Conversational Question Answering


摘要:在这项工作中,研究者对 SOTA 对话式 QA 系统进行了首次大规模的人类评估,其中人类评估员与模型进行对话,并判断其答案的正确性。该研究发现人机(human-machine)对话的分布与人 - 人(human-human )对话的分布有很大的不同,在模型排名方面,人类评估和黄金历史(gold history)评估存在分歧。
该研究进一步研究了如何改进自动评估,并提出了一种基于预测历史的问题重写机制,该机制可以与人类判断更好地关联。最后,该研究分析了各种建模策略的影响,并讨论了构建更好的对话式问答系统的未来方向。

使用 gold history 和 predicted history 的人类和自动评估示例。

使用 predicted history 的无效问题的示例。

问题重写示例。


推荐:ACL 2022 杰出论文之一。
ArXiv Weekly Radiostation

机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation,在 7 Papers 的基础上,精选本周更多重要论文,包括NLP、CV、ML领域各10篇精选,并提供音频形式的论文摘要简介,详情如下:
10 NLP Papers音频:00:0018:42

本周 10 篇 NLP 精选论文是:


1. Voxel-informed Language Grounding.  (from Trevor Darrell)2. ACCoRD: A Multi-Document Approach to Generating Diverse Descriptions of Scientific Concepts.  (from Daniel S. Weld)3. Interlock-Free Multi-Aspect Rationalization for Text Classification.  (from Boi Faltings)4. Consistent Human Evaluation of Machine Translation across Language Pairs.  (from Philipp Koehn)5. Directed Acyclic Transformer for Non-Autoregressive Machine Translation.  (from Yang Liu, Hang Li, Minlie Huang)6. Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner.  (from Dan Roth)7. LAGr: Label Aligned Graphs for Better Systematic Generalization in Semantic Parsing.  (from Dzmitry Bahdanau)8. Long-term Control for Dialogue Generation: Methods and Evaluation.  (from Kilian Q. Weinberger, Ryan McDonald)9. Twist Decoding: Diverse Generators Guide Each Other.  (from Dragomir Radev, Noah A. Smith)10. A Simple yet Effective Relation Information Guided Approach for Few-Shot Relation Extraction.  (from Yang Liu)

相关文章
|
缓存 关系型数据库 MySQL
MySQL慢查询优化策略
MySQL慢查询优化是一个复杂的过程,需要根据具体的应用场景和数据特点进行。以上策略是提升数据库查询性能的有效途径,但最关键的是对系统进行持续的监控和分析,及时发现并解决性能瓶颈。通过实践这些策略,你可以显著提高MySQL数据库的性能,为用户提供更快的响应时间和更好的体验。
437 10
|
JavaScript Java 关系型数据库
Springboot+vue的应急救援物资管理系统,Javaee项目,springboot vue前后端分离项目。
Springboot+vue的应急救援物资管理系统,Javaee项目,springboot vue前后端分离项目。
|
机器学习/深度学习 数据采集 数据可视化
R语言 一种功能强大的数据分析、统计建模 可视化 免费、开源且跨平台 的编程语言
R语言 一种功能强大的数据分析、统计建模 可视化 免费、开源且跨平台 的编程语言
958 1
|
7月前
|
前端开发 JavaScript 安全
7.6K Star Shadcn Admin:颜值与实力并存的后台管理系统,前端开发者的新宠!
"基于 Shadcn UI 和 Vite 打造的现代化管理后台,开箱即用的响应式设计 + 无障碍访问,让后台开发从未如此优雅!" —— 来自 GitHub 7.6K 星认证
1704 26
|
9月前
|
监控 安全 数据安全/隐私保护
如何有效防止验证码盗刷?
验证码盗刷是攻击者利用程序批量请求短信验证码,对用户和企业造成经济损失与骚扰的安全威胁。为更安全地完成身份验证,企业可以采用阿里云提供的防盗刷监控、号码认证及图形认证等服务。
812 11
|
运维 监控 安全
物联网卡:物联网卡为什么不能使用在手机上
物联网卡(IoT SIM卡)通常是为物联网设备设计的,这些设备包括但不限于智能家居设备、可穿戴设备、工业监控设备等。它们与用于智能手机的SIM卡有所不同,主要是因为设计目标、功能限制、资费结构以及网络接入策略上的差异。以下是物联网卡不能直接在手机上使用的主要原因:
|
边缘计算 人工智能 监控
边缘计算与AI结合的场景案例研究
【8月更文第17天】随着物联网(IoT)设备数量的爆炸性增长,对实时数据处理的需求也随之增加。传统的云计算模型在处理这些数据时可能会遇到延迟问题,尤其是在需要即时响应的应用中。边缘计算作为一种新兴的技术趋势,旨在通过将计算资源更靠近数据源来解决这个问题。本文将探讨如何将人工智能(AI)技术与边缘计算结合,以实现高效的实时数据分析和决策制定。
1347 1
|
存储 Java 大数据
Apache Arrow 新手上路
# 什么是Arrow [Apache Arrow](https://https://arrow.apache.org/)是一个开源的跨平台数据层开发框架,主要提供高效的、硬件加速的内存中数据计算能力。Apache Arrow的设计初衷是作为“新一代大数据系统的共享基础”,可以作为不同系统之间进行高效数据交换的媒介,同时提供快速、低延迟的数据访问接口。 Apache Arrow的主要目标是通过提
Apache Arrow 新手上路
|
SQL 存储 JSON
sqlmap中sqlmapapi的一点记录
sqlmap中sqlmapapi的一点记录
sqlmap中sqlmapapi的一点记录
|
存储 文字识别 Oracle
oracle RAC 更换存储迁移数据
oracle RAC 更换存储迁移数据我们利用ASM rebalance特性实现更换存储迁移数据的需求基本 零宕机时间(操作步骤总结)1)保证新存储和RAC当前节点间的可用性;2)新存储划分LUN,可以重新规划存储方案;3)迁移OCR和表决盘4)给现有ASM磁盘组添加...
1800 0