中国接收论文量登顶,斩获最佳论文:ACL 2021统计数据出炉

简介: 2021 年的 ACL 上,国人论文的占比继续增加,最佳论文奖也被收入囊中。

8 月 2 日,计算语言学、自然语言处理领域顶会第 59 届 ACL 大会及第 11 届亚洲自然语言处理学术会议 IJCNLP 联合会议(ACL-IJCNLP)以线上方式举行。

作为自然语言处理(NLP)领域的顶级学术会议,今年的 ACL 大会已是第 59 届,会议举办时间为 8 月 2 日 - 5 日。

中科院自动化所研究员宗成庆老师担任了今年的 ACL-IJCNLP 主席,程序主席包括华盛顿大学的夏飞教授(Fei Xia)和香港理工大学的李文捷(Wenjie Li)教授以及罗马大学的 Roberto Navigli。

在上周六机器之心于北京举办的 ACL 2021 论文分享会上,宗成庆老师向我们介绍了本届会议的一些数据信息。随着大会的开幕,我们可以看到更多有关今年 ACL 的论文数据,包括热门主题、中国学者的论文数据等。

从公开数据我们可以看到,今年共有 3350 篇投稿,其中包括 2327 篇长论文和 1023 篇短论文,这个数据相比去年(3429 篇)略有减少。在所有研究之中,有 710 篇最终被接收,接收率 21.2%。在今年的会议中,另有 493 篇论文被接收为 Findings,这额外 14.9% 的论文被接收到了大会的 Findings 子刊。

微信图片_20211206102236.jpg


在论文的方向上,机器学习、翻译、信息提取、语言交互系统等方向是人们探索的主流:

微信图片_20211206102240.jpg


值得注意的是,该会来自中国的论文投稿数量已经大幅超越美国,并领先其他国家与地区:共有 1239 篇论文投稿来自中国大陆,其中 251 篇被接收,接收率 20.3%。

微信图片_20211206102244.jpg


最佳论文 & 杰出论文

在大会正式召开之前,程序委员会公布了全部论文奖项。本届大会的最佳论文《Vocabulary Learning via Optimal Transport for Neural Machine Translation》来自中国机构字节跳动火山翻译团队,提出了一种新的词表学习方案 VOLT,在多种翻译任务上取得了优秀的结果。

微信图片_20211206102250.jpg



有趣的是,该研究修改前的版本曾投至另一个机器学习顶会 ICLR 2021。在 Openreview 网站上现在还能看到该论文及匿名评审的结果。当时四名评审给出的意见是 3、3、4、4——未达到接收标准,作者做了 rebuttal 之后撤稿转投 ACL 并获得了人们的认可。

从评审者的角度来看,这篇 ACL 2021 最佳论文和以往有所不同——以往经常是开创了新的方向,而今年研究的想法非常创新,且工作极为细致透彻。这是以往中国大陆学者所很少能够做到的程度。

今年的最佳主题论文(Best theme paper)研究来自卡耐基梅隆大学、巴伊兰大学、加劳德特大学与艾伦人工智能研究所等机构。第一作者殷绮妤(Kayo Yin)本科毕业于巴黎综合理工学院,目前是卡耐基梅隆大学的在读研究生。

微信图片_20211206102253.jpg


论文链接:https://arxiv.org/abs/2105.05222

此外,还有六篇论文获得了 ACL 2021 的杰出论文荣誉,包括港中文、腾讯 AI Lab、斯坦福大学(李飞飞、曼宁等人团队)的研究。

从 ACL 的论文投稿和接收数量来看,近几年来中国的 NLP 领域从追赶者逐渐成为国际舞台的主力军。对比曾在北京举办的 ACL 2015:那时中国的论文投稿数量还不及美国,整个大会也只有 318 篇接收论文。

微信图片_20211206102257.jpg


仍要关注到的是,国内论文投稿的接收率仍不及美国,在 NLP 的大方向上,还有很多地方值得努力。

宗成庆表示,国内论文数量的增长是人工智能领域近年来火热,以及新技术应用前景所推动的结果。随着 NLP 的发展,未来我们或许能看到更多投身这一领域的学者。

相关文章
|
存储 编解码 监控
C++与OpenGL结合实现的屏幕监控软件:高性能屏幕录制解决方案
使用C++和OpenGL结合,本文展示了如何创建高性能屏幕录制软件。通过OpenGL的`glReadPixels`获取屏幕图像,存储为视频文件,再利用C++的网络编程(如libcurl)将监控数据提交到网站。示例代码包括了屏幕捕获和数据上传的简单实现。
595 2
|
存储 安全 Shell
Git clone 克隆私有项目
Git clone 克隆私有项目
Git clone 克隆私有项目
|
9月前
|
存储 人工智能 TensorFlow
你的旧电脑还跑得动AI吗?ToDesk云电脑/青椒云/顺网云算力支持实测报告
随着AI大模型的崛起及广泛应用,旧电脑显示出了硬伤,硬件配置方面,老旧的 CPU、GPU 性能不足,运算速度缓慢,导致 AI 模型训练和推理耗时极长。内存与存储有限,无法承载大型 AI 数据集和复杂模型。散热不佳,运行 AI 任务时易过热死机。且旧电脑可能不兼容新的 AI 框架与工具,软件更新困难。这使得用户在利用旧电脑探索 AI 时,体验大打折扣,而 ToDesk云电脑、青椒云、顺网云等或许能为解决这些问题带来新契机。今天就来实测一下常用的ToDesk云电脑/青椒云/顺网云,博主将从功能、优缺点等方面为你深度剖析这几款云电脑,帮你选出最适合的那一款!🏆
730 5
FFmpeg【SDK01】日志和字典的使用
FFmpeg中日志功能的使用方法,包括日志级别的设置和AVDictionary的基本操作,同时展示了字符串解析函数如av_parse_video_size、av_parse_video_rate和av_parse_time的应用。
174 2
|
11月前
|
人工智能 自然语言处理 数据库
CHRONOS:阿里通义联合上海交大推出时间线摘要生成框架,适用于大规模新闻数据的时间线生成任务
CHRONOS 是由阿里通义实验室与上海交大联合推出的时间线摘要生成框架,支持开放域与封闭域,通过迭代自问自答机制生成连贯的时间线摘要,适用于新闻、金融、教育等多个领域。
615 15
CHRONOS:阿里通义联合上海交大推出时间线摘要生成框架,适用于大规模新闻数据的时间线生成任务
|
Cloud Native jenkins 持续交付
【云原生】使用PyCharm上传代码到Gitlab仓库并在Jenkins构建
【云原生】使用PyCharm上传代码到Gitlab仓库并在Jenkins构建
794 0
|
Shell Windows
vscode添加gitbash终端(最新)
vscode添加gitbash终端(最新)
1250 1
|
机器学习/深度学习 存储 分布式计算
阿里开源首个DL框架,新型XDL帮你搞定大规模稀疏数据
12 月 21 日,阿里巴巴旗下的大数据营销平台阿里妈妈开源了其应用于自身广告业务的算法框架 X-Deep Learning(XDL)。该框架非常擅长处理高维稀疏数据,对构建推荐、搜索和广告系统非常有优势。此外,阿里还配套发布了一系列官方模型,它们都是阿里在实际业务或产品中采用的高效模型。
1679 0
阿里开源首个DL框架,新型XDL帮你搞定大规模稀疏数据
|
数据采集 数据可视化 数据建模
数据模型依赖图的作用是什么?
数据模型依赖图的作用是什么?
368 2
|
机器学习/深度学习 人工智能 PyTorch
Transformers 4.37 中文文档(三十二)(1)
Transformers 4.37 中文文档(三十二)
320 0