微软的语音识别技术以及对扬声器独立的语音识别软件的出现,让我们开始关注语音识别技术的发展和应用。
IT行业有时候看起来就好像是城市中的公交车,可能很多年都没有变,但是突然出现了大量的改变。最近,Nuance公布了它最新版的语音识别软件Dragon Naturally Speaking 9,而微软也在经历过一次惨痛的失败后,在SpeechTEK大会上重新推出了他令人印象深刻的语音技术产品。
我曾经用过这两个语音识别软件的前一个版本,客观地说,如果使用高质量的麦克风,它们都有很好的表现。虽然我还没有用过Dragon 9,但是据用过的人说,它比以前的版本有了很大的进步。除了精确度有所提高外,它也是第一个具有独立扬声器模式的语音识别软件。如果这一功能真的有效,那么将为语音识别技术打开一个广阔的应用空间。
我一直认为对着电脑说话是应该被避免的,不过微软看上去好像并不认同,从他在Windows Vista中加入语音识别技术就可以看出。而且我认为当Windows Vista大面积发行后,微软将更加公开推动语音识别技术,但愿这不会导致像在公车上大声讲电话这种不文明行为的泛滥。
目前各界对于语音识别技术的研究热情令我有些惊讶,很多大型企业都有这方面的专业研究团队,各大院校的有关研究也很多。如果不是要对着电脑说话,如此大规模的研究又是为了什么?也许答案是网络应用。
欧洲电信标准协会(Etsi)有一个叫做Aurora的项目,即开发一套在移动网络上的分布式语音识别应用标准。该标准规定,部分语音识别引擎工作在移动终端设备上,并将语音传输给识别中心。我对这种应用的接受程度比前面所说的要大,毕竟对着手机说话要比对着笔记本说话容易被人接受。
Etsi表示,语音识别的其中一项应用是用户在路上对着电话讲述会议内容,然后将这些内容通过邮件发送给自己,以便在回到办公室或回到住所之后再对会议内容进行进一步编辑。这听上去挺不错的,用户不会再去考虑其它一些网络服务商所提供的类似收费服务了。
正如目前流行的SpinVox 服务所展示的,用户在收到语音信箱的留言后,不是听到录音,而是看到留言的文字内容。一个中央语音识别系统可以让企业网络也具有类似的功能,由于微软的Office Communications Server 2007 内置了语音识别技术,因此也许这会是企业的一个不错的选择。
比尔。盖茨说,语音识别技术将成为未来十年的一个主流技术,这一点我也认可,但是这种技术在网络应用中的规模也许比在独立PC应用上的规模更大。无论如何,企业现在也应该开始考虑一下,语音识别技术到底是不是会对自己的系统效率有提高作用。