数字视频基础（上）| 学习笔记-阿里云开发者社区

数字视频基础（上）| 学习笔记

2022-11-22 423

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 快速学习数字视频基础（上），介绍了数字视频基础（上）系统机制，以及在实际应用过程中如何使用。

开发者学堂课程【高校精品课-华中科技大学 -智能媒体计算：数字视频基础（上）】学习笔记，与课程紧密联系，让用户快速学习知识。

课程地址：https://developer.aliyun.com/learning/course/811/detail/15675

数字视频基础（上）

内容介绍：

一、基本概念

二、模拟电视的制式

三、视频扫描方式

四、视频的数字化

一、基本概念

视频又称运动图像，图像序列按照一定的频率播放，就像动画一样，视频本质上也是动画。

连续的随时间变化的一组图像就是视频，因此视频里最主要的就是图像，图像的一些属性在视频里面都是有的，只不过它是多帧图像，有时间维度，同时还有同步的声音一起呈现出视觉和听觉的效果。

也就是说视频是有配音的，是有音频信号的。电视有图像有声音，而图像和声音在视频里面是分别用两个通道分别存储的，本节主要介绍图像数据流，音频所有的规律是遵循数字音频中介绍的概念的。

常见的视频信号包括电影、电视、动画

视频数据的特点：

信息确切、直观、生动

信息量大、数据量大

压缩的视频信息实时性强

对计算机处理能力要求高

现在小朋友坐在电视机前可以安静地目不转睛地看动画，做别的事情可能就没有这么认真。因为视频信号非常生动、直观、形象。小朋友听故事的时候可以做别的事情，但是看动画片基本上两眼紧盯着屏幕，所以家长一般不允许长时间看屏幕，每天限定时间。

它的信息量很大，由于视频的信息量大，因为多帧图像连续播放，同时还有声音，所以说信息量大，同时数据量也大。

压缩视频可以进行实时的播放，同时也要求计算机的性能要很高，因此高清的视频处理需要高新能的计算机的。以手机为例，手机播放视频耗电就会很快，而且播放一段时间手机就会发烫，因为视频处理需要CPU高速的运转，而高速运转的原因是处理复杂，数据量大。

二、模拟电视的制式

不同国家有不同的制式，制式不同，其中的参数也不相同。

NTSC制式是美国、日本、台湾地区使用的，每一帧也就是每一幅图像是1525行，每秒钟30帧，30大于24，在视觉滞留效应中讲过，大于24就可以给人带来连续的效果，一幅图像可以在人脑中停留1/24秒，大于1/24，就有一种连续的感觉。还与国家发电频率有关，60Hz 取一半就是30，有的是每秒钟25帧，是因为国家的电压为50Hz。这样便于控制。

它是隔行扫描，每一帧先扫描奇数行，再扫描偶数行，共同生成一幅完整的图像；宽高比:4:3，电影为3:2；使用的颜色模型是YIQ。

PAL制式是中国、多数欧洲国家使用的。每帧625行，每秒25帧，隔行扫描，宽高比:4:3，颜色模型是 YUV。区别是把亮度单独分离出来，UV 和 IQ 分别指蓝色差和红色差。

SECAM 制式是法国、俄罗斯、东欧和中东国家，基本参数与PAL类似，不同的是色度信号是频率调制(FM)。两个色差信号:红色差和蓝色差按行顺序传输。

HDTV(高清晰度电视)，图像清晰度是现行电视的2倍，宽高比:16:9，多声道环绕声音。早期的很多大片都是HDTV，它的声音可以支持7.1以上的格式，现在除了 HDTV以外，还有UHDTV，超高清电视，如4K电视8K电视。目前热销的是4K。电视的屏幕越来越大，如果本身分辨率低，原来小电视上看到的图像放到大电视上看效果不好，因此4K 可能未来会成为主流。

模拟电视系统的对比：

模拟电视有制式，在数字电视中制式就不那么重要，因为已经把他变成了全是二进制的数。

三、视频扫描方式

所谓逐行扫描，就是一行挨着一行地扫描

隔行扫描就是把一幅图像分成奇数行和偶数行，奇数行扫一遍，偶数行扫一遍，最后这两个合在一起就是一幅完整的图像。

为什么这么做呢？相同的行数，如果逐行扫描，从第一行扫到最下面一行，使用时间很长，如果只扫描一半奇数行，就节省一半的时间，给人的感觉上画面就会稳定一些，先扫描一半，眼睛中已经存在一个画面，再扫描一遍是使得画面更清晰。如果变化很快的话，只扫描上半部分，下半部分没扫，就会有一些模糊的感觉。因此现在的电视采用的都是隔行扫描。

四、视频的数字化

视频信号从模拟信号到数字信号，图像是把空间的点变成数字的点，每个点由若干位描述它的颜色深度，视频里除了空间的图像之外，增加了时间维度，即帧频，每一帧图像就是数字信号里时间维度上的离散图像。帧频越高，数据量越大。由25帧变成30帧，每秒钟多了5幅图像；变为50帧，就多了一倍的图像。但总的来讲，其他的帧频确定之后，主要视频质量就取决于每一帧图像的分辨率以及颜色深度，这在图像里已经讲过了，这里不再赘述。