仅数百参数,Google发布「最小偏差」音频分类前端LEAF

简介: Mel-filterbank经常被用于训练声音分类算法,然而它存在的偏差也令其有明显的局限性。近日,Google提出了一种优于Mel-filterbank的前端LEAF,这种前端可以创建出具有最小偏差的音频分类模型。

微信图片_20220112115506.png


在机器学习中,梅尔滤波器组(Mel-filterbank)这种固定的、手工制作的声音表示,经常被用于训练声音分类算法中。

 

在它出现几十年后,研究表明,它们表现出了适合表示学习的数学特性;

 

换句话说,它们代表了强大的音频特征。

 

但是Mel-filterbank的设计也存在偏差,而这些偏差,对于在高频率下需要细粒度分辨率的任务来说,是有害的

 

为了解决这一问题,向人工智能替代领域迈进,谷歌的研究人员开发了「LEAF」。


微信图片_20220112115508.png


该前端将Mel滤波器组分解为了几个成分——过滤、池化和压缩/标准化,来创建具有最小偏差的音频分类模型

 

研究人员称,LEAF可以学习到一组性能优于Mel-filterbank的参数,这表明,LEAF可以用于通用音频分类任务。

 

目前,该文章已经在ICLR2021上正式登出。


声音识别市场庞大,LEAF应运而出,涵盖八大分类问题


根据Grand View Research的数据,我们可以发现,到2018年,全球声音识别市场的价值已经达到了6650万美元,因此,LEAF的产生非常具有现实意义。

 

除了在语音识别领域的用处,听觉能力本身也已经成为人工智能的关键:

 

声音可以使AI能够理解环境,并区分环境中发生的各种事件。

 

例如,如果有人入侵,带有AI驱动的声音感应技术的事件管理系统会打开灯,并大声播放音乐来阻止入侵,同时,它还会向住户发送警报。


微信图片_20220112115510.png


图:Amazon的Echo Dot


而LEAF的出现,为这类产品的生产无遗提供了极大便利。

 

在实验中,研究人员使用LEAF开发了八种不同分类问题的独立单任务监督模型:

 

这八种分类问题包括了声音场景分类、鸟鸣检测、情感识别、说话人识别、乐器和音高检测、关键字识别和语言识别

 

研究人员表示,使用LEAF创建的模型优于或几乎优于所有替代品,或与其他前端有着相匹配的准确性。


仅仅几百参数,LEAF源代码即将上线

 

Google的研究团队计划在不久后发布他们的模型、baseline、以及经过预训练前端的源代码。

 

在论文中,研究者写道:

 

「在这项工作中,我们提出了一个有可信度的能实现替代Mel-filterbank的模型,应该评估其在多个任务的表现这一观点,


此外,我们还做出了对于广泛多样声音信号的可学习的前端的深入研究,其中,声音信号包含了语音、音乐、音频事件以及动物声音等等」

 

「通过将Mel-filterbank分解为三个部分,我们提出了一种全新的前端——LEAF。该前端仅由几百个参数控制,并且所有操作都是完全可学习的。



「当为每个独立的任务训练不同的模型时,上述优点都存在。此外,这些结果在具有挑战性的大规模基准测试中也得到了证明。」

 

 

参考链接:

https://venturebeat.com/2021/01/25/researchers-propose-leaf-a-frontend-for-developing-ai-classification-algorithms/


相关文章
|
6月前
|
前端开发
调试前端时,在浏览器上修改参数并重新调用接口
有时候我们的页面点击过了,但是接口出问题,想修改参数再调用一次,一般是用apiPost工具把接口复制,再加上token和参数,但是这样非常的效率比较低。
662 0
|
6月前
|
前端开发
[牛客网-前端大挑战QD2] 获取url参数
[牛客网-前端大挑战QD2] 获取url参数
52 0
|
11月前
|
算法 前端开发 程序员
前端算法专栏-数组-75.颜色分类
前端算法专栏-数组-75.颜色分类
前端算法专栏-数组-75.颜色分类
|
25天前
|
机器学习/深度学习 弹性计算 自然语言处理
前端大模型应用笔记(二):最新llama3.2小参数版本1B的古董机测试 - 支持128K上下文,表现优异,和移动端更配
llama3.1支持128K上下文,6万字+输入,适用于多种场景。模型能力超出预期,但处理中文时需加中英翻译。测试显示,其英文支持较好,中文则需改进。llama3.2 1B参数量小,适合移动端和资源受限环境,可在阿里云2vCPU和4G ECS上运行。
|
1月前
|
JSON 前端开发 数据格式
@RequestMapping运用举例(有源码) 前后端如何传递参数?后端如何接收前端传过来的参数,传递单个参数,多个参数,对象,数组/集合(有源码)
文章详细讲解了在SpringMVC中如何使用`@RequestMapping`进行路由映射,并介绍了前后端参数传递的多种方式,包括传递单个参数、多个参数、对象、数组、集合以及JSON数据,并且涵盖了参数重命名和从URL中获取参数的方法。
54 0
@RequestMapping运用举例(有源码) 前后端如何传递参数?后端如何接收前端传过来的参数,传递单个参数,多个参数,对象,数组/集合(有源码)
|
25天前
|
移动开发 算法 前端开发
前端常用算法全解:特征梳理、复杂度比较、分类解读与示例展示
前端常用算法全解:特征梳理、复杂度比较、分类解读与示例展示
20 0
|
2月前
|
存储 前端开发 JavaScript
前端基础(十一)_函数声明及调用、函数的形参与实参、arguments参数、函数的参数类型、函数中的问题
本文介绍了JavaScript中函数的声明及调用、形参与实参的概念、arguments对象的使用、函数参数的类型以及函数中this的作用。通过示例代码详细解释了函数如何接收参数、如何处理参数个数不匹配的情况,以及函数在不同上下文中this的指向。
22 1
|
3月前
|
前端开发 JavaScript
这篇文章介绍了如何使用form表单结合Bootstrap格式将前端数据通过action属性提交到后端的servlet,包括前端表单的创建、数据的一级和二级验证,以及后端servlet的注解和参数获取。
这篇文章介绍了使用AJAX技术将前端页面中表单接收的多个参数快速便捷地传输到后端servlet的方法,并通过示例代码展示了前端JavaScript中的AJAX调用和后端servlet的接收处理。
这篇文章介绍了如何使用form表单结合Bootstrap格式将前端数据通过action属性提交到后端的servlet,包括前端表单的创建、数据的一级和二级验证,以及后端servlet的注解和参数获取。
|
6月前
|
前端开发 BI
jeecgboot中前端使用带有参数报表的方法
jeecgboot中前端使用带有参数报表的方法
318 0
|
2月前
|
前端开发 JavaScript
前端JS截取url上的参数
文章介绍了两种前端JS获取URL参数的方法:手动截取封装和使用URLSearchParams。
46 0