今年 10 月份,国际语音识别领域著名学者,前约翰霍普金斯大学教授、 语音识别开源工具 Kaldi 之父 Daniel Povey 在 Twitter 上表示,他将加入小米,来北京工作。
时间过得很快,这位知名学者在小米的全新职业生涯已经提前开始。
亮相小米开发者大会
在小米第三届开发者大会 MIDC 2019 开幕前一天,小米创始人兼 CEO 雷军即在微博上宣布,Daniel Povey 将出任小米集团语音首席科学家,直接汇报给集团副总裁、技术委员会主席崔宝秋。此外,他也将首次露相开发者大会,分享「AI 语音领域的未来技术趋势」。
有关这位 AI 大牛的经历,在这里就不必详述了,他加盟中国公司也获得了语音识别社区的极大关注。
在正在进行的小米开发者大会上,Daniel 来到了现场。小米集团副总裁、小米技术委员会主席崔宝秋在演讲中表示,Daniel Povey 上周刚到北京,他将很快在北京组建独立研发团队。
崔宝秋表示,「Daniel Povey 是一个单纯的技术人员,非常符合小米的价值观——他要求自己在小米期间的工作必须保证 100% 开源。在未来,小米将继续加大在 Kaldi 上的投入,帮助打造一个国际化的开源社区,希望小米可以引领开源的语音识别技术。」
毫无疑问,Daniel Povey 是一个人工智能的重量级学者,人们对于小米招揽这样一位大牛花费了多少资源非常感兴趣。「其实大家有点想歪了,Povey 在前来小米参观的时候,主动和我们讲他不需要很高的年薪,」崔宝秋介绍道。「小米带给他的优厚条件,可以说是强大的手机+IoT 生态,重视语音技术研发的背景,以及小米深厚的开源文化。」
据说,Povey 来 10 月份前来小米时,在介绍完自己的工作之后就迫不及待地去到小米工位上,想要了解公司的工作环境和工程师们的工作氛围。
小米认为,手机是今天 AI 的最大应用平台,而从 IoT 到 AIoT 的发展将是一个质变。从过去的互联互通到未来的整体互联服务中,语音交互非常重要。小米将在 Povey 等人的带领下,在语音+视觉多模态交互等方向加速进行技术研发。
「KALDI 之父 Daniel Povey 能够来到小米是非常幸运的一件事,小米希望能够占据技术的制高点。当然,小米也会以全面开源的姿态参与技术的发展。」崔宝秋说道。
短短一个月,MACE 支持 Kaldi
小米去年 6 月就开源了移动端深度学习框架 MACE。在两天前,MACE 框架发布了最新的更新,在此次更新中可以看到,框架已支持了知名开源语音识别系统 Kaldi。
MACE 开源地址:https://github.com/XiaoMi/mace/releases
Kaldi 是一个开源的语音识别系统,由 Daniel Povey 主导开发,在很多语音识别测试和应用中广泛使用。
MACE 作为小米提前布局的开源产品,是一个可在移动端使用的异构计算平台神经网络框架。通过这一框架,小米可在移动端布局各类深度学习应用和算法,包括计算机视觉、语音识别等。据小米不完全统计,MACE 每天被调用 5000 万次。
在 MACE 的提供的模型中已出现了 Kaldi。
从 Kaldi 模型内可以看到,Kaldi 的 nnet2 和 nnet3 模型已被转换为了 ONNX 文件。ONNX 文件是一种通用的 AI 模型文件,支持在多个深度学习开发框架中使用。
据相关页面信息显示,MACE 已经支持大部分 Kaldi 系统内组件,以及 ONNX 形式的的 Kaldi 模型。此外,项目还提供了 Kaldi-onnx 转换工具。
具体转换后的模型列表如下:
本次加入对 Kaldi 的支持,无疑将进一步加强小米 MACE 在语音识别方面的优势。小米表示,他们会尊重 Povey 的想法和价值观,继续推进深度学习相关的开源工作。
此外,小米还准备在未来一两个月开源 MACE-Kit 和超低功耗计算设备。