数字音频基础(上)| 学习笔记

简介: 快速学习数字音频基础(上),介绍了数字音频基础(上)系统机制, 以及在实际应用过程中如何使用。

开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算数字音频基础(上)】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/811/detail/15667


数字音频基础(上)


内容分析:

一、声音的定义

二、描述声音的参数

三、声音的频率

四、声音的传播方向

五、声音的三要素


一、声音的定义

1、声音是指自然声,声音是振动的波,振动所具有的特性它都具有,震动是随时间连续变化的物理量。简言之,声音是波,波是随时间变化的一个物理量。

声音曲线:

image.png

2、声音具有普通波的特性,例如反射(对着大山喊,大山会回声)、折射和衍射。

3、声音信号由许多频率不同的信号组成,它不是一个单一的频率的信号,它是多种频率的信号叠加在一起的。这类信号称为复合信号,而组成复合信号的单一频率的信号称为分量信号。


二、描述声音的参数

1、振幅——波的高低幅度,表示声音的强弱、大小

例:手机里面有一个音量的按钮,电视里面也有音量

2、周期——两个相邻波之间的时间长度

3、频率——每秒里面有多少个周期数,每秒钟振动的次数,以 Hz 为单位

⑴模拟设备中,频率指每秒的周期数。

模拟的设备里面通过频率来表征信号的变化的快慢

⑵数字系统中,数据量用码率。(每秒的位)( bps )

频率直接与数据量相关,每秒钟频率变化越多,所需数据量越多,码率值越大。

image.png

4、声音是一种复合信号

5、带宽——用来描述组成复合信号的频率

⑴高保真声音的频率范围20-20000 Hz

现在这种高级的组合音响声称可以还原高保真声音

它的频率范围是2万 Hz 减去20 Hz ,约等于2万赫兹,就是20千赫。

带宽约为20 KH (不等于网络带宽,网络带宽指传输速度,但是都表达的是一个范围


三、声音的频率

1、人所能听到的声音是有一个范围的

亚音频:<20 Hz (人听不见了,很多动物可以听到,比如大象)

人耳可听域(音频):20-20000 Hz 话音:300-3000 Hz

超声波:>20000 Hz (有一些动物也能听到,比如海豚。在很多领域,比如医学包括一些安防领域里面也有超声。)

image.png

2、按照声源来看一看频率范围。比如人,不同的性别的人实际上能够发出和听到的声音范围也是不同的。

男性语音:100 Hz -9000 Hz (男性的声音要偏低)

女性语音:150 Hz -10000 Hz

这是一般的人的范围,但是很多歌唱家的范围就不在这个范围里面,像男高音那是一定大于1万的女高音也是特别高。整个的范围里面,实际上人的声域里面就是低音范围,就是低音发的特别好的人。数量相对偏少的,因此是很紧缺的。

设备类:

电话语音:200 Hz -3400 Hz (原来那种语音电话,它的频率范围是有限的,因此它的声音的质量是不够高的。)

调幅广播( AM ):50 Hz -7000 Hz

调频广播( FM ):20 Hz -15000 Hz

调频广播声音效果

高级音响:10 Hz -40000 Hz (例如高保真,这样的音响它的价格就很贵。)

声音的高低其实是取决于频率的


四、声音的传播方向

1、声音以振动波的形式从声源向四周传播。

比如说这是一个钟这个钟定时以后会响这个声音被我们听到,人耳听到的声音是怎么来辨别声音的传播方向的呢?

人脑相当于一个计算机,一个 CPU。两只耳朵实际上就是输入设备,就相当于电脑的话筒一样。这两个耳朵把声音采集到我们的大脑里边。大脑会计算这个声音传递到我们两只耳朵的时间的先后这个时间的差,就可以判断是来自于我们偏左还是偏右,是远还是近

image.png

因此一个健康的人的五官是非常重要的,人长两只耳朵是为了辨别声音的方向。所以耳朵越灵敏越健康实际上人整个行走也好,还是日常生活里面,都会非常的方便,因此要保护好我们的每一个器官。

人类在辨别声源位置时,首先依靠声音到达左右两耳的微小时间差和强度差异进行辨别,然后经过大脑综合分析而判断出声音来自何方

3、声音是具有波的一切特性。从声源直接到达人类听觉器官的声音是“直达声”。声音从声源发出后,经过多次反射到达人类听觉器官的声音是“反射声”。

在智慧教室里,为了提高声音的质量,通常是要做一些吸音的处理。

什么叫吸音?它可以把一些这个反射声把它吸收掉。例如去演唱会的现场,比如说音乐厅,其实它的墙壁上也做了很多的这种吸音的处理。其实就是为了避免这种不同角度的回升造成的干扰。


五、声音的三要素

1、音调——高低

比如说某人的声音特别尖,是说他的音调。某人他歌唱得特别地低沉也是说的音调。音调是由频率决定的。

以下是不同频率声音:什么都没改变,只是改变了它的频率

image.png

2、音强(音量)——强弱、大小

同样的人同样的频率,但是把声音提高了,幅度变大了,声音的强度由幅值决定的

image.png

3、音色——特质

音色实际上是由发声的这种器件它本身的频率范围决定的。不同的乐器发出来的声音是有自己的特点的,这就叫音色。

image.png

相关文章
Qt 布局管理之 停靠窗口QDockWidget
Qt 布局管理之 停靠窗口QDockWidget
528 0
|
程序员 Python
|
自然语言处理 监控 算法
|
4月前
|
消息中间件 前端开发 JavaScript
如何开发工程项目部管理系统中的WBS分解板块(附架构图+流程图+代码参考)
本文详细解析了如何将工程项目中的WBS(工作分解结构)系统化,通过拆解“大工程”为可执行的小单元,实现责任明确、变更可控、联动管理与风险降低。内容涵盖系统架构、业务流程、数据模型、前后端实现、关键路径算法及最小可跑代码(MVP),并提供数据库设计、接口定义与React前端示例,助力快速落地工程项目管理系统。
|
6月前
|
存储 安全 Java
2025 年最新 40 个 Java 基础核心知识点全面梳理一文掌握 Java 基础关键概念
本文系统梳理了Java编程的40个核心知识点,涵盖基础语法、面向对象、集合框架、异常处理、多线程、IO流、反射机制等关键领域。重点包括:JVM运行原理、基本数据类型、封装/继承/多态三大特性、集合类对比(ArrayList vs LinkedList、HashMap vs TreeMap)、异常分类及处理方式、线程创建与同步机制、IO流体系结构以及反射的应用场景。这些基础知识是Java开发的根基,掌握后能为后续框架学习和项目开发奠定坚实基础。文中还提供了代码资源获取方式,方便读者进一步实践学习。
1830 2
|
SQL 监控 关系型数据库
MySQL数据库中如何检查一条SQL语句是否被回滚
检查MySQL中的SQL语句是否被回滚需要综合使用日志分析、事务状态监控和事务控制语句。理解和应用这些工具和命令,可以有效地管理和验证数据库事务的执行情况,确保数据的一致性和系统的稳定性。此外,熟悉事务的ACID属性和正确设置事务隔离级别对于预防数据问题和解决事务冲突同样重要。
346 2
|
缓存 负载均衡 应用服务中间件
Nginx 实现一个端口代理多个前后端服务
【10月更文挑战第19天】Nginx 的强大功能不仅限于此,它还可以与其他技术和工具相结合,为我们的应用提供更强大的支持和保障。在不断发展的互联网时代,掌握 Nginx 的使用技巧将为我们的工作和生活带来更多的便利和效益。
|
小程序 API 开发工具
支付宝支付对接案例详解
支付宝支付对接指南,涵盖电脑网站、当面付和手机网站支付方式。对接前需了解支付宝开放平台和商家平台的区别,完成注册、实名认证、创建应用及签约产品等步骤。配置支付环境包括API密钥、回调地址和开发环境搭建。提供三种SDK供选择,推荐使用alipay-easysdk。详细步骤和示例代码可参考官方文档。
1180 15
ArcGIS:如何进行离散点数据插值分析(IDW)、栅格数据的重分类、栅格计算器的简单使用、缓冲区分析、掩膜?
ArcGIS:如何进行离散点数据插值分析(IDW)、栅格数据的重分类、栅格计算器的简单使用、缓冲区分析、掩膜?
1020 0
|
人工智能 自然语言处理 API
利用Python调用KimiGPT API接口
Kimi作为国内目前广受欢迎的AI工具,因其出色的性能和智能功能,迅速赢得了大量用户的青睐。随着用户量的激增,系统在高峰时段可能会面临响应压力。正是借助这一热潮,Kimi团队适时推出了其API服务,使用户和开发者能够更加灵活和深入地集成和使用Kimi的智能功能。