视频小白入门--福优学苑@音视频+流媒体

视频小白入门

***【在线视频教程】***

好文章，来自【福优学苑@音视频+流媒体】

1、引言

如今我们所处的时代，是移动互联网时代，也可以说是视频时代。

从快播到抖音，从“三生三世”到“三十而已”，我们的生活，被越来越多的视频元素所影响。

而这一切，离不开视频拍摄技术的不断升级，还有视频制作产业的日益强大。

此外，也离不开通信技术的飞速进步。

试想一下，如果还是当年的56K Modem拨号，或者是2G手机，你还能享受到现在动辄1080P甚至4K的视频体验吗？

除了视频拍摄工具和网络通信技术升级之外，

我们能享受到视频带来的便利和乐趣，还有一个重要因素，就是视频编码技术的突飞猛进。

视频编码技术涉及的内容太过专业和庞杂，市面上的书籍或博客多数都只是枯燥的技术概念罗列，对于新手来说读完后依然糊里糊涂，我打算将借此机会，专门给大家做一个关于视频编码的零基础科普。

2、目录结构

▼ 本文涉及概念较多，为了方便阅读，本文的内容目录对应如下：

************************************

1、引言
2、系列文章
3、图像基础知识  
3.1）什么是像素？
3.2）什么是PPI？
3.3）颜色在计算机里是如何表示的？
4、视频编码基础知识
4.1）视频和图像和关系
4.2）未经编码的视频数据量会有多大？
4.3）什么是编码？

***********************************

3、图像基础知识

3.1什么是像素？

说视频之前，先要说说图像。

图像，大家都知道，是由很多“带有颜色的点”组成的。这个点，就是“像素点”。

像素点的英文叫Pixel（缩写为PX）。

这个单词是由 Picture(图像) 和 Element（元素）这两个单词的字母所组成的。

▲ 电影《像素大战（Pixels）》，2015年

像素是图像显示的基本单位。

我们通常说一幅图片的大小，例如是1920×1080，就是长度为1920个像素点，宽度为1080个像素点。

乘积是2,073,600，也就是说，这个图片是两百万像素的。

1920×1080，这个也被称为这幅图片的分辨率。

▲ 分辨率也是显示器的重要指标

3.2什么是PPI？

那么，我们经常所说的PPI又是什么东西呢？

PPI，就是“Pixels Per Inch”，每英寸像素数。

也就是，手机（或显示器）屏幕上每英寸面积，到底能放下多少个“像素点”。

这个值当然是越高越好啦！

PPI越高，图像就越清晰细腻。

以前的功能机，例如诺基亚，屏幕PPI都很低，有很强烈的颗粒感。

后来，苹果开创了史无前例的“视网膜”（Retina）屏幕，

PPI值高达326（每英寸屏幕有326像素），画质清晰，再也没有了颗粒感。

3.3颜色在计算机里是如何表示的？

像素点必须要有颜色，才能组成缤纷绚丽的图片。

那么，这个颜色，又该如何表示呢？

大家都知道，我们生活中的颜色，可以拥有无数种类别。

▲ 光是妹纸们的口红色号，就足以让我们这些屌丝瞠目结舌。。。

在计算机系统里，我们不可能用文字来表述颜色。

不然，就算我们不疯，计算机也会疯掉的。

在数字时代，当然是用数字来表述颜色。

这就牵出了“彩色分量数字化”的概念。

以前我们美术课学过，任何颜色，都可以通过红色（Red）、绿色（Green）、蓝色（Blue）按照一定比例调制出来。

这三种颜色，被称为“三原色”。

在计算机里，R、G、B也被称为“基色分量”。

它们的取值，分别从0到255，一共256个等级（256是2的8次方）。

所以，任何颜色，都可以用R、G、B三个值的组合表示。

▲ RGB=(183,67,21)

通过这种方式，一共能表达多少种颜色呢？

256×256×256=16,777,216种，因此也简称为1600万色。

RGB三色，每色有8bit，这种方式表达出来的颜色，也被称为24位色（占用24bit）。

这个颜色范围已经超过了人眼可见的全部色彩，所以又叫真彩色。

再高的话，对于我们人眼来说，已经没有意义了，完全识别不出来。

4、视频编码基础知识

4.1视频和图像和关系

好了，刚才说了图像，现在，我们开始说视频。

所谓视频，大家从小就看动画，都知道视频是怎么来的吧？

没错，大量的图片连续起来，就是视频。

衡量视频，又是用的什么指标参数呢？

最主要的一个，就是帧率（Frame Rate）。

在视频中，一个帧（Frame）就是指一幅静止的画面。

帧率，就是指视频每秒钟包括的画面数量（FPS，Frame per second）。

帧率越高，视频就越逼真、越流畅。

4.2未经编码的视频数据量会有多大？

有了视频之后，就涉及到两个问题：

一个是存储；
二个是传输。

而之所以会有视频编码，

关键就在于此：一个视频，如果未经编码，它的体积是非常庞大的。

以一个分辨率1920×1280，帧率30的视频为例：

共：1920×1280=2,073,600（Pixels 像素），每个像素点是24bit（前面算过的哦）；
也就是：每幅图片2073600×24=49766400 bit，8 bit（位）=1 byte（字节）；
所以：49766400bit=6220800byte≈6.22MB。

这是一幅1920×1280图片的原始大小，再乘以帧率30。

也就是说：每秒视频的大小是186.6MB，每分钟大约是11GB，一部90分钟的电影，约是1000GB。。。

怎么样呢？

就算你现在电脑硬盘是4TB的（实际也就3600GB），也放不下几部大片呀！

不仅要存储，还要传输，不然视频从哪来呢？

如果按照100M的网速（12.5MB/s），下刚才那部电影，需要22个小时。。。

我的天哪，再次崩溃。。。

正因为如此，屌丝工程师们就提出了，必须对视频进行编码。

4.3什么是编码？

编码：就是按指定的方法，将信息从一种形式（格式），转换成另一种形式（格式）。

视频编码：就是将一种视频格式，转换成另一种视频格式。

编码的终极目的，说白了，就是为了压缩。

各种五花八门的视频编码方式，都是为了让视频变得体积更小，有利于存储和传输。

我们先来看看，视频从录制到播放的整个过程，如下：

首先是视频采集。

通常我们会使用摄像机、摄像头进行视频采集。

采集了视频数据之后，就要进行模数转换，将模拟信号变成数字信号。

其实现在很多都是摄像机（摄像头）直接输出数字信号。

信号输出之后，还要进行预处理，将RGB信号变成YUV信号。

前面我们介绍了RGB信号，那什么是YUV信号呢？

简单来说，YUV就是另外一种颜色数字化表示方式。

视频通信系统之所以要采用YUV，而不是RGB，主要是因为RGB信号不利于压缩。

在YUV这种方式里面，加入了亮度这一概念。

在最近几十年中，视频工程师发现，眼睛对于亮和暗的分辨要比对颜色的分辨更精细一些，也就是说，人眼对色度的敏感程度要低于对亮度的敏感程度。

所以，工程师认为，在我们的视频存储中，没有必要存储全部颜色信号。

我们可以把更多带宽留给黑—白信号（被称作“亮度”），将稍少的带宽留给彩色信号（被称作“色度”）。

于是，就有了YUV。

YUV里面的“Y”，就是亮度（Luma），“U”和“V”则是色度（Chroma）。

大家偶尔会见到的Y'CbCr，也称为YUV，是YUV的压缩版本，不同之处在于Y'CbCr用于数字图像领域，YUV用于模拟信号领域，MPEG、DVD、摄像机中常说的YUV其实就是Y'CbCr。

▲ YUV（Y'CbCr）是如何形成图像的

YUV码流的存储格式其实与其采样的方式密切相关。

（采样，就是捕捉数据）

主流的采样方式有三种：

1）YUV4:4:4；
2）YUV4:2:2；
3）YUV4:2:0。

这里我们简单介绍一下。

具体解释起来有点繁琐，大家只需记住，通常用的是YUV4:2:0的采样方式，能获得1/2的压缩率。

这些预处理做完之后，就是正式的编码了。

好文章，来自【福优学苑@音视频+流媒体】
***【在线视频教程】***