语音技术

首页 标签 语音技术
# 语音技术 #
关注
6699内容
阿里人工智能实验室王刚:找到合适的应用场景是实现人工智能商业化的关键点
王刚博士是今年3月加入阿里人工智能实验室的,在此之前,他在南洋理工大学担任副教授(终身教授),专注于深度学习的研究,是众多转投工业界的学术专家之一。
深度学习在语音识别中的声学模型以及语言模型的应用
目前深度学习在图像和语音识别等领域应用越来越广泛,比如图像处理类应用、视频归纳、智能客服,以及延伸的服务机器人领域、车载助手等,本文着重介绍深度学习在语音识别中声学模型与语言模型中的应用,如FSMN,LSTM,RNN等网络结构的设计,比传统的结构在效果上有巨大的提升
人工智能PK金牌速记员之实战录
引言 在2016年3月23日阿里云年会上,2000余名同学们见证了一场人机大战的好戏--阿里云iDST团队的实时语音识别系统在现场演讲分享环节实时挑战世界速记比赛亚军, 马总御用金牌速录师姜毅先生。这位神一般的速录师, 拥有超人的短时记忆功能, 超级的打字速度和惊人的正确率.要PK这样的对
DFSMN在阿里巴巴的应用以及如何采用开源代码训练DFSMN模型
DFSMN模型是语音识别中一种先进的声学模型,语音识别中的声学模型是语音识别技术中的核心所在。具体来说,声学模型是根据输入语音进行发音可能性的识别,结合语言模型、解码器,就构成了完整的语音识别系统。本次开源的DFSMN模型,是阿里巴巴的高效工业级实现,相对于传统的LSTM、BLSTM等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。
基于Tacotron汉语语音合成的开源实践
2017年初,Google 提出了一种新的端到端的语音合成系统——Tacotron。
阿里巴巴高杰:3年风雨路,阿里巴巴自然语音交互的探索与经验教训
随着语音交互、自然语言处理、多模态等技术的发展,人机交互方式已经变得越来越简单,目前人机交互已经成为行业最热的研究方向之一。那么,未来人机交互的发展趋势什么呢?阿里巴巴智能语音交互专家高杰在《云栖大讲堂第三期|未来人机交互技术沙龙》上为大家分享了在阿里巴巴智能个人助理构建过程中所积累的经验和教训。
阿里云RPA:助力企业自动化升级和数字化转型
读取信息、录入单据、订单分类、发送邮件,这些重复而繁琐的工作占据了大量的时间,现在RPA的出现将彻底改变这一现状,“将重复的事交给RPA做”,这句话已经由标语变为现实。随着技术升级、算法精进,机器人流程自动化(Robotic Process Automation,RPA)由一个陌生的词汇逐渐为人们所知。
特定人语音唤醒简介
特定人语音唤醒,就是通过识别语音中所含的内容和人的身份信息,来实现特定人语音唤醒功能。这是一种较为新颖、具有一定安全性、便捷性和趣味性的功能,同时可以增强个性化体验。
基于阿里云API打造“Kim智能语音助理”
阿里云API应用创新大赛作品系列之-Kim智能语音音箱是如何基于阿里云API来实现开源的。
免费试用