华中科技大学VLR组原作解读SeqFormer & IDOL:视频实例分割新SOTA

简介: 华中科技大学VLR组原作解读SeqFormer & IDOL:视频实例分割新SOTA

视频实例分割是一个近几年兴起并逐渐引起广泛关注的领域,它要求算法同时完成视频中的物体的检测、分割、分类、以及跟踪。目前主流的视频实例分割算法可以被分为 Online 和 Offline 两种范式,Online 模型通过逐帧分割并添加后处理进行跟踪,将图像实例分割算法扩展到视频实例分割任务上。Offline 模型通过将整段视频输入以同时获得分割和跟踪的结果。这两种范式各有其特色以及特殊的应用场景。

本次分享中,来自华中科技大学、字节跳动、约翰霍普金斯大学的研究者们提出了分别基于 Offline 和 Online 范式的两个视频实例分割 SOTA 模型:SeqFormer 和IDOL,这两篇工作现在都已经被 ECCV2022 接受为 Oral。在此之前,Online 模型的性能远远落后于 Offline 模型,该工作深入分析了此前 Offline 和 Online 模型性能相差巨大的原因,揭示了视频实例分割任务的关键问题,并且补齐了这个差距,让这两种范式回到相同的起跑线上。此外 IDOL 在第四届大规模视频物体分割挑战赛( 4th Large-scale Video Object Segmentation Challenge,CVPR2022)的视频实例分割赛道上取得第一名。

相关文章
|
机器学习/深度学习 自然语言处理 并行计算
Self-Attention 原理与代码实现
Self-Attention 原理与代码实现
1195 0
|
XML 开发框架 前端开发
WPF学习之基础知识篇
WPF(Windows Presentation Foundation)具有一个复杂且强大的架构,旨在提供丰富的用户界面、图形、动画和多媒体功能。
486 9
|
人工智能 运维 监控
2025 AI 原生编程挑战赛 数据获取文档
本文介绍了参赛者如何配置阿里云服务以参加AI运维赛。首先开通阿里云日志服务,随后创建RAM用户并为其分配访问权限。接着为该用户授权,确保其具备读取数据的权限。最后,可选地创建或重新生成AccessKey以用于后续的数据查询操作。整个流程帮助选手完成基础环境配置,以便使用阿里云日志服务进行数据分析。
2693 2
|
机器学习/深度学习 人工智能 大数据
基于联邦学习的数据隐私保护机制在智能模型训练中的应用
【8月更文第15天】随着大数据和人工智能的发展,数据隐私保护成为了亟待解决的问题。传统的集中式机器学习方法需要将数据收集到一个中心服务器进行处理,这不仅增加了数据泄露的风险,还可能触犯相关的法律法规。联邦学习(Federated Learning, FL)作为一种新兴的分布式机器学习框架,允许终端设备直接在本地数据上训练模型,并仅将更新后的模型参数发送给中心服务器汇总,从而在不暴露原始数据的情况下实现模型训练。
799 0
|
人工智能 开发者
AI 助理能为我做什么?
阿里云AI助理融合了大模型能力,聚焦于开发者在阿里云平台上的关键需求,提供包括云产品咨询、权益活动推荐、下单购买引导、云资源查询与诊断等服务,助力开发者快速解决问题,提高业务效率,让云上开发之旅更加顺畅。
1049 0
|
关系型数据库 MySQL API
MySQL 历史数据迁移到 Elasticsearch
MySQL 历史数据迁移到 Elasticsearch
578 4
|
SQL 数据库 索引
SQL Server开启变更数据捕获(CDC)
SQL Server开启变更数据捕获(CDC)
|
Python
`return` 和 `yield` 关键字之间的区别
【8月更文挑战第29天】
559 5
Vue3 antdv 如何动态渲染 icons-vue 图标(a-icon 不支持了)
Vue3 antdv 如何动态渲染 icons-vue 图标(a-icon 不支持了)
878 0
|
机器学习/深度学习 数据采集 监控
算法金 | 选择最佳机器学习模型的 10 步指南
许多刚入门的学习者也面临着相似的挑战,特别是在项目启动初期的方向确定和结构规划上。本文意在提供一份全面指南,助你以正确的方法开展项目。 遵循本文提供的每一步至关重要(虽有少数例外)。就像不做饭或点餐就无法享用美食一样,不亲自动手构建模型,就无法实现模型部署。
565 7
算法金 | 选择最佳机器学习模型的 10 步指南

热门文章

最新文章