AIGC玩转卡通化技术实践
伴随着持续不断的AIGC浪潮,越来越多的AI生成玩法正在被广大爱好者定义和提出,图像卡通化(动漫化)基于其还原效果高,风格种类丰富等特点而备受青睐。早在几年前,伴随着GAN网络的兴起,卡通化就曾经风靡一时。而今,伴随着AIGC技术的兴起和不断发展,扩散生成模型为卡通化风格和提供了更多的创意和生成的可能性。本文就将详细介绍达摩院开放视觉团队的卡通化技术实践。
2022云栖内容精选—AI助力新型电力系统建设
摘要:本文整理自达摩院决策智能实验室负责人印卧涛,在云栖大会的分享。本篇内容主要分为三个部分:
1. “双碳”目标下的新型电力系统与挑战
2. 在电力预测、调度决策、虚拟电厂决策方向的创新与积累
3. 关于未来的产品展望
INTERSPEECH 2022论文解读|针对多方会议场景下说话人相关语音识别的对比研究
INTERSPEECH是由国际语音通讯协会 (International Speech Communication Association, ISCA) 创办的语音信号处理领域顶级旗舰国际会议。历届INTERSPEECH会议都备受全球各地语音语言领域人士的广泛关注。
本文主要对比研究三种SA-ASR的方法,通过对说话人日志、语音分离和语音识别模块的耦合,在M2MeT竞赛上发布的真实会议场景语料库AliMeeting上进行了相关实验,有效地降低了说话人相关字错误率(SD-CER)。论文已被INTERSPEECH 2022接收。
天气炎热等公交,实时查询动口不动手|语音AI在高德
近日,高德地图发布新版本,由达摩院语音实验室提供全链路技术支持的“小德”智能语音助手实现了业内首家支持实时公交查询和播报的功能。公交车到哪儿了,动动嘴即可实时掌握。目前,该语音助手已实现地点查询、驾车导航、公交地铁查询、实时公交、打车等全出行场景的语音操控。