数字音频基础（上）| 学习笔记-阿里云开发者社区

数字音频基础（上）| 学习笔记

2022-11-22 486

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习数字音频基础（上），介绍了数字音频基础（上）系统机制，以及在实际应用过程中如何使用。

开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算：数字音频基础（上）】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/811/detail/15667

数字音频基础（上）

内容分析：

一、声音的定义

二、描述声音的参数

三、声音的频率

四、声音的传播方向

五、声音的三要素

一、声音的定义

1、声音是指自然声，声音是振动的波，振动所具有的特性它都具有，震动是随时间连续变化的物理量。简言之，声音是波，波是随时间变化的一个物理量。

声音曲线：

2、声音具有普通波的特性，例如反射（对着大山喊，大山会回声）、折射和衍射。

3、声音信号由许多频率不同的信号组成，它不是一个单一的频率的信号，它是多种频率的信号叠加在一起的。这类信号称为复合信号，而组成复合信号的单一频率的信号称为分量信号。

二、描述声音的参数

1、振幅——波的高低幅度，表示声音的强弱、大小

例：手机里面有一个音量的按钮，电视里面也有音量

2、周期——两个相邻波之间的时间长度

3、频率——每秒里面有多少个周期数，每秒钟振动的次数，以 Hz 为单位

⑴模拟设备中，频率指每秒的周期数。

模拟的设备里面通过频率来表征信号的变化的快慢。

⑵数字系统中，数据量用码率。（每秒的位）（ bps ）

频率直接与数据量相关，每秒钟频率变化越多，所需数据量越多，码率值越大。

4、声音是一种复合信号

5、带宽——用来描述组成复合信号的频率

⑴高保真声音的频率范围20-20000 Hz

现在这种高级的组合音响声称可以还原高保真声音

它的频率范围是2万 Hz 减去20 Hz ，约等于2万赫兹，就是20千赫。

⑵带宽约为20 KH （不等于网络带宽，网络带宽指传输速度，但是都表达的是一个范围）

三、声音的频率

1、人所能听到的声音是有一个范围的

亚音频：＜20 Hz （人听不见了，很多动物可以听到，比如大象）

人耳可听域（音频）：20-20000 Hz 话音：300-3000 Hz

超声波：>20000 Hz （有一些动物也能听到，比如海豚。在很多领域，比如医学包括一些安防领域里面也有超声。）

2、按照声源来看一看频率范围。比如人，不同的性别的人实际上能够发出和听到的声音范围也是不同的。

男性语音：100 Hz -9000 Hz （男性的声音要偏低）

女性语音：150 Hz -10000 Hz

这是一般的人的范围，但是很多歌唱家的范围就不在这个范围里面，像男高音那是一定大于1万的，女高音也是特别高。整个的范围里面，实际上人的声域里面就是低音范围，就是低音发的特别好的人。数量相对偏少的，因此是很紧缺的。

设备类：

电话语音：200 Hz -3400 Hz （原来那种语音电话，它的频率范围是有限的，因此它的声音的质量是不够高的。）

调幅广播（ AM ）：50 Hz -7000 Hz

调频广播（ FM ）：20 Hz -15000 Hz

调频广播声音效果更好。

高级音响：10 Hz -40000 Hz （例如高保真，这样的音响它的价格就很贵。）

声音的高低其实是取决于频率的

四、声音的传播方向

1、声音以振动波的形式从声源向四周传播。

比如说这是一个钟，这个钟定时以后会响，这个声音被我们听到，人耳听到的声音是怎么来辨别声音的传播方向的呢？

人脑相当于一个计算机，一个 CPU。两只耳朵实际上就是输入设备，就相当于电脑的话筒一样。这两个耳朵把声音采集到我们的大脑里边。大脑会计算这个声音传递到我们两只耳朵的时间的先后。这个时间的差，就可以判断是来自于我们偏左还是偏右，是远还是近。

因此一个健康的人的五官是非常重要的，人长两只耳朵是为了辨别声音的方向。所以耳朵越灵敏越健康，实际上人整个行走也好，还是日常生活里面，都会非常的方便，因此要保护好我们的每一个器官。

人类在辨别声源位置时，首先依靠声音到达左右两耳的微小时间差和强度差异进行辨别，然后经过大脑综合分析而判断出声音来自何方。

3、声音是具有波的一切特性。从声源直接到达人类听觉器官的声音是“直达声”。声音从声源发出后，经过多次反射到达人类听觉器官的声音是“反射声”。

在智慧教室里，为了提高声音的质量，通常是要做一些吸音的处理。

什么叫吸音？它可以把一些这个反射声把它吸收掉。例如去演唱会的现场，比如说音乐厅，其实它的墙壁上也做了很多的这种吸音的处理。其实就是为了避免这种不同角度的回升造成的干扰。

五、声音的三要素

1、音调——高低

比如说某人的声音特别尖，是说他的音调。某人他歌唱得特别地低沉也是说的音调。音调是由频率决定的。

以下是不同频率声音：什么都没改变，只是改变了它的频率

2、音强（音量）——强弱、大小

同样的人同样的频率，但是把声音提高了，幅度变大了，声音的强度由幅值决定的

3、音色——特质

音色实际上是由发声的这种器件它本身的频率范围决定的。不同的乐器发出来的声音是有自己的特点的，这就叫音色。