本资料借鉴:仅用于学习和讨论,如有侵权请联系【语音识别实战】计算机博士带你一口气学完语音合成、分离、变声三大实战模块,简直不要太爽了!_AI/人工智能/计算机视觉/深度学习/机器学习_哔哩哔哩_bilibili
今天来讨论一下,语音识别现在有了一个声音数据,如何做一个识别那?
语音识别到底要干什么,输入是我们的语音信号,一般语音就是一个.we文件,最终结果是翻译成最终我想要说的什么,有了语音之后,可以看WE文件
先把数据进行一个编码,做一个特征,转化成一个向量就是一个解码的过程。
我们一般有一个编码的,和一个解码的,你是想把语音转文字,把文字转语音都行
举个例子,在时间中你会越来越,少看见RNN结构,而是发现卷积结构,RNN结构的缺点是不能考虑到更远的结构,现在通常是卷积和RNN相搭配