系列解读:深度时空视觉表征学习方法及应用

简介: 系列解读:深度时空视觉表征学习方法及应用


视觉表征学习是人工智能领域的一个重要分支,它也是大部分计算机视觉与多媒体任务的基石。近几年受自然语言处理领域 Transformer 结构的启发,视觉表征学习的网络架构也从传统卷积神经网络(CNN)演变到 Vision Transformer 的设计范式。此外,得益于无监督、自监督机器学习的技术发展,视觉表征学习的训练模式逐渐摆脱了对大量人工标注数据的严重依赖,涌现出一系列高性能的自监督视觉表征学习技术。因此本次分享将由京东科技视觉技术创新团队的四位研究员分别介绍深度时空视觉表征学习(图像、视频及 3D 视觉)在网络架构和自监督训练模式这两个维度上的一系列技术创新,例如针对图像和视频表征学习的高性能 Transformer 结构(CoTNet、Wave-ViT、Dual-ViT、SIFA、DTF)。



12 月 20 日 19:00-21:00
主题一:图像表征学习方法及应用分享嘉宾:潘滢炜,京东科技视觉技术创新团队资深研究员,谷歌学术引用率 5000 余次,曾获微软学者奖学金、ACM SIGMM China 最佳博士论文奖和新星奖、ACM Multimedia 最佳演示系统奖和最佳开源项目奖。

主题二:自监督表征学习方法及应用分享嘉宾:亚龙,京东科技视觉技术创新团队资深研究员。在人工智能、计算机视觉领域国际会议如 CVPR, ICCV, ICLR, AAAI 等发表论文 20 余篇,并获得 ACM MM 图像检索、CVPR 细粒度图像识别等多项竞赛冠军。
主题三:视频表征学习方法及应用分享嘉宾:邱钊凡,京东科技视觉技术创新团队研究员,主要研究兴趣是视频内容理解、多媒体数据分析和多媒体内容检索等方向,在相关领域国际会议上发表论文 20 余篇,谷歌学术引用率三千余次,曾获微软学者奖学金、ACM SIGMM China 最佳博士论文奖。
主题四:3D视觉表征学习方法及应用分享嘉宾:蔡琪,京东科技视觉技术创新团队研究员,在 CVPR、NeurIPS、TIP 等会议期刊发表多篇无监督学习、目标检测相关论文,曾获得 VisDA 跨域目标检测、SAPIEN ManiSkill 2021 机械臂比赛等多项竞赛冠军,相关研究工作在物流场景中落地应用。

相关文章
|
测试技术
Pytest----多进程并行执行自动化测试脚本
Pytest----多进程并行执行自动化测试脚本
1427 0
Pytest----多进程并行执行自动化测试脚本
|
22天前
|
人工智能 Linux API
AI小龙虾OpenClaw怎么装?阿里云+Mac/Win/Linux部署,免费大模型对接一步到位
2026年的AI工具生态里,OpenClaw(Clawdbot)凭借“能落地、可操作、本地化”的核心优势成为新晋热门,被大家亲切称为“AI小龙虾”。不同于ChatGPT、豆包等仅能提供对话建议的AI工具,OpenClaw更像一位能实打实帮你干活的“数字员工”——它能在电脑上自动执行操作、定时完成任务、永久记忆你的使用习惯,还能对接飞书、钉钉等多平台实现高效交互。近期大量技术小白和从业者都在问:“OpenClaw到底是什么?要不要装?怎么装?”本文将从核心原理、多端部署(阿里云+MacOS/Linux/Windows11)、阿里云百炼免费大模型API配置、实际使用场景到常见问题解答,一次性讲透O
862 4
|
8月前
|
自然语言处理 前端开发 测试技术
Playwright初学指南 (2):全面解析元素定位策略
本文深入解析Playwright革命性的元素定位体系,详解八大核心定位策略(语义化角色、文本内容、标签属性等)及其适用场景,提供动态元素处理方案和调试技巧。通过定位策略性能对比和企业级最佳实践,帮助开发者构建健壮、可维护的自动化测试脚本,有效解决75%的Web自动化测试失败问题。
|
机器学习/深度学习 编解码 算法框架/工具
经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)
经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)
885 1
经典神经网络论文超详细解读(二)——VGGNet学习笔记(翻译+精读)
|
9月前
|
编解码 文字识别 API
InternVL3开源:7种尺寸覆盖文、图、视频处理,多模态能力扩展至工业图像分析
4月11日,OpenGVLab开源发布InternVL3系列多模态大模型,涵盖1B至78B共7个尺寸。相比InternVL 2.5,其在多模态感知与推理能力上表现更优,并新增工具使用、GUI代理等功能。得益于原生多模态预训练,文本性能超越Qwen2.5系列。
1238 0
|
机器学习/深度学习 运维 自然语言处理
当深度学习遇上故障根因分析:运维人的绝佳拍档
当深度学习遇上故障根因分析:运维人的绝佳拍档
538 17
|
机器学习/深度学习 算法
基于心电信号时空特征的QRS波检测算法matlab仿真
本课题旨在通过提取ECG信号的时空特征并应用QRS波检测算法识别心电信号中的峰值。使用MATLAB 2022a版本实现系统仿真,涵盖信号预处理、特征提取、特征选择、阈值设定及QRS波检测等关键步骤,以提高心脏疾病诊断准确性。预处理阶段采用滤波技术去除噪声,检测算法则结合了一阶导数和二阶导数计算确定QRS波峰值。
|
弹性计算 固态存储 ice
阿里云ECS服务器2核16G、4核32G和8核64G不同配置租赁价格表
2024年阿里云服务器提供多种配置与实例规格,如2核16G、4核32G及8核64G等,用户可根据需求选择内存型r8i、通用算力型u1等不同架构。以2核16G为例,r8i每月334.19元起,u1则为286.2元起。公网带宽与系统盘亦有多档价位。实际价格与折扣请参照官网。
861 5
|
网络协议 Linux 网络安全
如何使用 ping 命令进行故障排除**
【8月更文挑战第24天】
820 0
|
存储 Java 关系型数据库
基于Java的汽车在线销售系统
基于Java的汽车在线销售系统

热门文章

最新文章