M2MeT技术分享会 @ICASSP 2022 倒计时!

简介: 国际顶级语音会议 ICASSP 2022 (International Conference on Acoustics, Speech, and Signal Processing) 线上会议将于北京时间 5月7日-5月13日 举行。

image.png

国际顶级语音会议 ICASSP 2022 (International Conference on Acoustics, Speech, and Signal Processing) 线上会议将于北京时间 5月7日-5月13日 举行。

阿里巴巴达摩院语音实验室希尔贝壳联合举办的针对会议场景的多通道多方会议转录挑战(M2MeT)也将于线上举行技术分享和总结讨论会多位国际知名行业专家包括达摩院语音实验室负责人鄢志杰、研究员马斌,希尔贝壳CEO卜辉,希尔贝壳基金会谢磊教授,美国俄亥俄州立大学汪德亮教授,丹麦奥尔堡大学谭政华教授,上海交通大学钱彦旻教授,新加坡A*STAR资讯通信研究院高级科学家Kong Aik Lee等参与会议组织和评审。

M2MeT技术分享会

北京时间:5月7日(星期六) 21:00-21:45

线上会议地址:点击文末阅读原文,跳转网页
会议预览我们做了哪些研究?—— 1场总结论文,6场项目论文,相继分享会议将由主办方介绍总结论文开启,参与挑战项目的团队--腾讯语音团队港中文大学中国科学技术大学喜马拉雅语音团队昆山杜克大学同花顺语音团队字节跳动语音团队将详细介绍他们的参与论文及技术方案。

>>CHAL-3.1

SUMMARY ON THE ICASSP 2022 MULTI-CHANNEL MULTI-PARTY MEETING TRANSCRIPTION GRAND CHALLENGE

Authors:Fan Yu, Shiliang Zhang, Zhihao Du, et. al.

>>CHAL-3.2

THE CUHK-TENCENT SPEAKER DIARIZATION SYSTEM FOR THE ICASSP 2022 MULTI-CHANNEL MULTI-PARTY MEETING TRANSCRIPTION CHALLENGE

Authors:Naijun Zheng, Xixin Wu, Lingwei Meng, Jiawen Kang, Helen Meng, The Chinese University of Hong Kong, China; Na Li, Chao Weng, Dan Su, Tencent AI Lab, China; Haibin Wu, National Taiwan University, China

>>CHAL-3.3

THE USTC-XIMALAYA SYSTEM FOR THE ICASSP 2022 MULTI-CHANNEL MULTI-PARTY MEETING TRANSCRIPTION (M2MET) CHALLENGE

Authors: Maokui He, Xiaoqi Zhang, Yuxuan Wang, Shutong Niu, Jun Du, University of Science and Technology of China, China; Xiang Lv, Weilin Zhou, Jingjing Yin, Yuhang Cao, Heng Lu, Ximalaya Inc., China; Chin-Hui Lee, Georgia Institute of Technology, United States of America

>>CHAL-3.4

CROSS-CHANNEL ATTENTION-BASED TARGET SPEAKER VOICE ACTIVITY DETECTION: EXPERIMENTAL RESULTS FOR M2MET CHALLENGE

Authors: Weiqing Wang, Duke University, United States of America; Xiaoyi Qin, Ming Li, Duke Kunshan University, China

>>CHAL-3.5

THE VOLCSPEECH SYSTEM FOR THE ICASSP 2022 MULTI-CHANNEL MULTI-PARTY MEETING TRANSCRIPTION CHALLENGE

Authors: Chen Shen, Yi Liu, Wenzhi Fan, Bin Wang, Shixue Wen, Yao Tian, Jun Zhang, Jingsheng Yang, Zejun Ma, bytedance, China

>>CHAL-3.6

THE ROYALFLUSH SYSTEM OF SPEECH RECOGNITION FOR M2MET CHALLENGE

Authors: Shuaishuai Ye, Peiyao Wang, Shunfei Chen, Xinhui Hu, Xinkang Xu, Hithink RoyalFlush Information Network Co.,Ltd., China


-------------M2MeT------------

欢迎对该技术领域感兴趣的研究人员关注 M2MeT Grand Challenge Session

Session网页:

https://2022.ieeeicassp.org/view_session.php?SessionID=1333

M2MeT官网:

https://www.alibabacloud.com/m2met-alimeeting

目录
相关文章
|
机器学习/深度学习 自然语言处理 并行计算
Self-Attention 原理与代码实现
Self-Attention 原理与代码实现
1298 0
|
12月前
|
人工智能 自然语言处理 数据可视化
让AI单次生成4万字!WriteHERE:开源AI长文写作框架,单次生成超长文本,小说报告一键搞定!
WriteHERE是基于异质递归规划技术的开源AI写作框架,能动态分解写作任务并管理任务依赖关系,支持单次生成超过4万字的专业报告。
2154 55
让AI单次生成4万字!WriteHERE:开源AI长文写作框架,单次生成超长文本,小说报告一键搞定!
|
JavaScript 前端开发 定位技术
|
12月前
|
人工智能 Linux iOS开发
音乐人必看!OpenUtau:开源AI歌声合成神器,快速打造专业级虚拟歌手,中文日文无缝切换
OpenUtau是一款开源的歌声合成工具,兼容UTAU音源库和重采样器,支持多语言界面及预渲染功能,让音乐创作更加高效便捷。
3543 15
音乐人必看!OpenUtau:开源AI歌声合成神器,快速打造专业级虚拟歌手,中文日文无缝切换
|
机器学习/深度学习 人工智能 数据挖掘
AI4Science之分子材料成像调研洞察
分子成像在材料科学中意义重大,通过位形空间、频率空间和光谱学等成像方法,揭示材料微观结构与动态变化。结合AI技术,可深入理解材料特性,解决能源、环境等问题。然而,该领域数据复杂,尚无统一的数据集和Benchmark,模型也处于初期阶段。本文从成像方法、任务类型、机器学习模型、数据集与Benchmark、Python工具包及通用模型等多个维度进行了调研,探讨了多模态数据利用、大规模数据集构建等关键问题,并列举了相关参考论文。
|
缓存 关系型数据库 MySQL
Mac安装brew
Mac安装brew
2781 6
|
人工智能 自然语言处理 算法
GPT-4 Turbo 和 GPT-4 的区别
GPT-4 vs GPT-4 Turbo: 探索OpenAI的顶级模型,GPT-4以其出色的文本生成和理解闻名,适合高端内容需求,但成本高;GPT-4 Turbo,优化版,提供相似性能但更高效、经济,适用于大规模商业应用,尤其在速度和资源效率上展现优势。用户可根据质量、效率和成本需求选择合适模型。
645 4
|
安全 测试技术
奥斯本检核表法
奥斯本检核表法
963 0

热门文章

最新文章