手指压缩:现代编解码器如何工作?





创建视频监控系统时,数据存储成本通常成为主要成本项目。但是,如果世界上没有能够压缩视频信号的算法,它们将变得无与伦比。在今天的文章中,我们将讨论现代编解码器的有效性以及它们工作的原理。



为了清楚起见,让我们从数字开始。以全高清分辨率(至少在您要充分使用视频分析功能的情况下,这是最低要求,现在)和实时(即每秒25帧的帧速率)连续录制视频。还假设我们选择的硬件支持H.265硬件编码。在这种情况下,使用不同的图像质量设置(高,中和低),我们将获得大约以下结果。



编解码器



框架中的运动强度



每天的磁盘空间使用量,GB



H.265(高质量)





138



H.265(高质量)



平均



67



H.265(高质量)





41



H.265(中等质量)





86



H.265(中等质量)



平均



42



H.265(中等质量)





26



H.265(低质量)





81



H.265(低质量)



平均



39



H.265(低质量)





24





但是,如果原则上不存在视频压缩,我们将看到完全不同的数字。让我们尝试找出原因。视频流无非是一系列具有一定分辨率的静态图片(帧)。从技术上讲,每个帧都是一个二维数组,其中包含有关构成图像的基本单位(像素)的信息。 TrueColor需要3个字节来编码每个像素。因此,在给定的示例中,我们将得到一个比特率:



1920×1080×25×3/1048576 =〜148 Mb / s



考虑一天中有86400秒,数字确实是天文数字:



148×86400/1024 = 12487 GB



因此,如果在给定条件下以最高质量录制视频而没有压缩,那么我们将需要12 TB磁盘空间来存储白天从单个摄像机接收的数据。但是,即使是公寓或小型办公室的安全系统,也必须至少存在两个视频记录设备,而如果法律要求,则存档本身必须保存数周甚至数月。也就是说,要服务任何对象,即使大小很小,都需要整个数据中心!



幸运的是,现代视频压缩算法可以大大节省磁盘空间:例如,使用H.265编解码器可以将视频大小减少90(!)倍。归功于一大堆各种技术的成功,这些技术长期以来不仅在视频监控领域而且在“民用”领域也得到了成功的使用:在模拟和数字电视系统,业余和专业摄影以及许多其他情况下。



最简单,最明显的例子是颜色二次采样。这是一种视频编码方法的名称,其中故意降低帧的颜色分辨率,并且色差信号的采样率小于亮度信号的采样频率。从人类生理学的角度以及从视频记录领域的实际应用的角度来看,这种视频数据压缩方法都是完全合理的。我们的眼睛善于注意到亮度的差异,但是它们对颜色变化的敏感度要低得多,这就是为什么可以牺牲色差信号的采样的原因,因为大多数人根本不会注意到这一点。同时,很难想象在通缉名单上如何宣布“蜘蛛在策划犯罪”颜色的汽车:定向将显示为“深灰色”,这是正确的,因为否则,阅读汽车描述的人甚至不会理解。我们在说什么阴影。



但是随着细节的减少,一切都变得完全不同。从技术上讲,量化(即将信号范围划分为多个级别,然后将其调整为指定的值)效果很好:使用此方法,视频大小可以缩小很多倍。但是通过这种方式,我们可能会错过重要的细节(例如,远处驶来的汽车数量或入侵者的面部特征):它们将变得模糊,这样的记录对我们来说将毫无用处。在这种情况下如何进行?答案很简单,就像一切巧妙的方法一样:一旦将动态对象作为参考点,一切都会立即落到位。自从H.264编解码器问世以来,已经成功使用了这一原理,并证明了它为数据压缩打开了许多其他可能性。



这是可以预见的:弄清楚H.264如何压缩视频



让我们回到开始时的表格。如您所见,除了分辨率,帧速率和图片质量等参数外,决定视频最终尺寸的决定性因素还在于所拍摄场景的动态程度。这是由于一般现代视频编解码器(尤其是H.264)的工作特性所致:其中使用的帧预测机制使您可以额外压缩视频,而实际上并没有牺牲图像质量。让我们看看它是如何工作的。



H.264编解码器使用几种类型的帧:



  • I帧(从英语内部编码帧开始,也称为“密钥”或“密钥”)-包含有关长时间不变的静态对象的信息。
  • P- (Predicted frames, , ) — , , I-.
  • B- (Bi-predicted frames, ) — P-, I-, P- B-, , .


这是什么意思?在H.264编解码器中,视频图像的结构如下:摄像机制作参考帧(I帧),并在其基础上(这就是为什么称其为参考帧)从帧中减去图像的固定部分。这将创建一个P帧。然后从第二个帧中减去第三个帧,并创建一个修改的P帧。这将创建一系列差分帧,这些差分帧仅包含两个连续帧之间的变化。结果,我们得到了以下链:



[捕获的开始] IPPPPPPPPPPPPP- ...



由于在减法过程中,可能会导致图形伪像出现的错误,因此在重复一定数量的帧之后,重复该方案:再次形成关键帧,然后形成一系列框架变化。



…-PPPPPPPIPPPPPPP ...



完整图像是通过将P帧“叠加”在参考帧上形成的。同时,可以独立处理背景和移动对象,这使您可以额外节省磁盘空间,而不会丢失重要细节(面部特征,车牌等)。在物体进行单调运动的情况下(例如,汽车的旋转车轮),可以重复使用相同的差速器框架。





静态和动态对象的独立处理可以节省磁盘空间,



这种机制称为帧间压缩。预测帧是基于对大量固定场景状态样本的分析而形成的:该算法可预测该对象在摄像机视场中的移动位置,这可以显着减少观察道路等情况下的记录数据量。





编解码器形成帧以预测对象将移动的位置。



反过来,双向预测帧的使用可以减少多次访问流中每个帧的时间,因为仅解压缩三个帧即可接收它:B包含链接,而I和他指的P。在这种情况下,帧序列可以描述如下。



[开始捕获] IBPBPBPBPBPBPBPBPBP-…



这种方法可以显着提高快进的速度,并显示和简化视频存档的工作。



H.264和H.265有什么区别?







H.265使用与H.264相同的压缩原理:将背景图像保存一次,然后仅记录源自移动对象的更改,这不仅可以显着降低存储要求,还可以降低带宽要求网络功能。但是,在H.265中,许多运动预测算法和方法已经发生了明显的质变。



因此,编解码器的更新版本开始使用可变大小的编码树(编码树单元,CTU)的宏块,分辨率高达64×64像素,而以前这种块的最大大小仅为16×16像素。这使得可以显着提高动态块提取的精度,以及4K或更高分辨率的帧处理效率。



此外,H.265还具有改进的解块滤波器-一种负责平滑块边界的滤波器,这对于消除沿着其连接线的伪影是必不可少的。最后,由于对运动对象进行编码时预测的准确性有了根本性的提高,因此改进的运动矢量预测器(MVP)算法有助于显着减少视频的体积,这是通过增加跟踪方向的数量实现的:如果以前仅考虑8个矢量,现在- 36。



除了上述所有功能之外,H.265还改进了对多线程的支持:现在可以彼此独立地处理编码过程中将每个帧划分为的正方形区域。还支持Wavefront并行处理(WPP),这也提高了压缩性能。当激活WPP模式时,从左到右逐行执行CTU处理,但是,如果从先前处理的CTU接收到的数据足以完成此操作,则即使在上一行完成之前,也可以开始对每个后续行进行编码。各种CTU字符串的移位延时编码,随着对扩展指令集AVX / AVX2的支持,它可以进一步提高多核和多处理器系统中视频流的处理速度。



监控闪存卡:大小不是唯一的问题时



再一次,让我们回到开始今天对话的平板电脑上。让我们计算一下,如果要以最高的视频质量存储最近30天的视频档案,需要多少磁盘空间:



138×30/1024 = 4



按照当今的标准,工业级硬盘的4 TB容量几乎没有用:现代硬盘用于视频监控的容量高达14 TB,每年的工作资源高达360 TB,MTBF高达150万小时。至于存储卡,事实并非如此简单。



在IP摄像机中,闪存卡扮演着备份存储的角色:它们上的数据不断地被覆盖,以便在与视频服务器失去连接的情况下,可以从本地副本中恢复丢失的视频片段。这种方法可以显着提高整个安全系统的容错能力,但是同时存储卡本身承受着巨大的压力。



从表中可以看到,即使图像质量较低且帧中的活动最少,一天内仍将录制约24 GB的视频。这意味着128GB卡将在不到一周的时间内被完全覆盖。如果我们需要获得最高质量的图像,那么这种介质上的所有数据将每天被完全更新一次!这仅在全高清分辨率下。如果我们需要4K图片怎么办?在这种情况下,负载将几乎翻倍(在给定条件下,最高质量的视频将需要250 GB)。



在日常使用中,这是根本不可能的,因此,即使是最廉价的存储卡也可以连续数年为您提供服务,而不会出现任何故障。这全都归功于损耗均衡算法。他们的工作可以示意性地描述如下。让我们从商店购买一个全新的闪存卡。我们用16 GB的7 GB录制了几个视频。一段时间后,我们删除了一些不必要的视频,释放了3 GB的空间,并录制了2 GB的新视频。似乎可以使用刚刚释放的空间,但是损耗均衡机制将为新数据分配之前从未使用过的那部分内存。尽管现代控制器以一种更为复杂的方式“混洗”位和字节,但一般原理仍然相同。







回想一下,由于电子通过介电层的量子隧穿,信息位的编码通过改变存储单元中的电荷而发生,这导致介电层逐渐磨损,随后发生电荷泄漏。而且,特定单元中电荷变化的频率越高,失效越早。损耗均衡的目的恰恰是确保每个可用单元都被覆盖大约相同的次数,因此有助于延长存储卡的使用寿命。



很容易猜到,如果闪存卡始终被完全覆盖,那么磨损平衡将不再发挥重要作用:在这里,芯片本身的耐用性就显得格外重要。评估后者的最客观标准是闪存可以承受的最大编程/擦除周期数,或者简称为P / E周期。另外,TBW(已写入的兆字节)系数非常准确,在这种情况下是说明性的(因为我们可以提前计算重写量)。如果技术特征中仅列出了所列指标之一,则将不难计算其他指标。使用以下公式就足够了:



TBW =(容量×P / E周期数)/ 1000



因此,例如,容量为128 G的闪存卡的TBW(资源为200 P / E)将为:(128×200)/ 1000 = 25.6 TBW。



让我们指望。消费级存储卡的使用寿命为100-300 P / E,最佳状态下为300。根据这些数字,我们可以以很高的精度估算其使用寿命。让我们使用公式并为128GB存储卡填写新表格。让我们以全高清的最高画质作为指导,也就是说,正如我们之前发现的那样,相机每天将录制138 GB的视频。



存储卡资源,P / E周期



TBW



平均无故障时间



100



12.8



3个月



200



25.6



6个月



300



38.4



1年





想使用64GB卡或编写4K视频吗?随意将计算时间除以二:平均而言,消费类存储卡每六个月必须更换一次,并且每个摄像机都必须更换一次。也就是说,每6个月您将不得不购买一批新的闪存卡,这将招致额外的维护成本,并且当然会危及受保护的物体,因为在更换相机时必须将其停用。



最后,选择存储卡时还要特别注意的一点是它的速度特性。在几乎所有现代闪存卡的描述中,您都可以找到以下形式的条目:“性能:读取时最高100 MB / s,写入时最高90 MB / s;录像:“ C10,U1,V10”。这里的C10和U1只不过是视频记录速度等级,如果看参考资料,则C10,U1和V10等级对应于10 MB / s。 9倍的差值从何而来?为什么标记是三倍?实际上,一切都非常简单。



在所考虑的示例中,100和90 MB / s是标称速度,即卡在顺序读取和写入操作中的最大可实现性能,前提是该卡与本身具有足够性能的兼容硬件一起使用。 C10,U1和V1(10 MB / s)是最坏测试条件下的最小持续传输速率。选择CCTV摄像机卡时必须考虑此参数,原因很简单:如果事实证明它低于视频流的比特率,则记录中会出现图形伪像,甚至会丢失整个帧。显然,对于安全系统而言,这是不可接受的:图片中的任何缺陷都充斥着关键数据的丢失-例如,可以帮助捕获入侵者的证据。



至于同时存在三个标记,其原因纯粹是历史原因。 C10属于SD卡协会创建的第一个分类,该分类早在2006年进行了编译,并获得了简单而又简单的名称Speed Class。 U1速度标记表明UHS速度类别的出现与超高速接口的创建有关,该接口如今已在绝大多数闪存卡中使用。最后,SD卡协会在2016年针对支持超高清视频记录(4K,8K和3D)的设备的激增开发了最后一个分类,即Video Speed Class(V1)。



由于列出的分类部分重叠,因此我们为您准备了一个比较表,其中将闪存卡的速度特性相互比较,并与不同分辨率的视频相关联。



速度级



UHS速度等级



视频速度等级



最低持续写入速度



视频分辨率



C2



--



--



2 MB /秒



标清视频录制(SD,720 x 576像素)



C4



--



--



4 MB /秒



高清(HD)视频录制,包括全高清(720p至1080p / 1080i)



C6



--



V6



6 MB /秒



C10



U1



V10



10 MB /秒



每秒60帧的全高清(1080p)视频录制



--



U3



V30



30 MB /秒



视频录制高达4K分辨率和60/120 fps



--



--



V60



60 MB /秒



以8K分辨率和每秒60/120帧的帧速率录制视频文件



--



--



V90



90 MB /秒





应该记住,表中给出的对应关系与业余,半专业和专业摄像机有关。在视频监视行业中,实时记录的最大速率为每秒25帧,并使用预测编码将高性能H.264和H.265编解码器用于压缩视频流,在大多数情况下,与U1类对应的存储卡就足够了。 / V10,因为这种情况下的比特率几乎不会超过10 MB / s的阈值。



WD Purple监控用microSD卡







考虑到上述所有功能,西部数据开发了专门的WD Purple microSD存储卡系列,当前包括两个产品系列:WD Purple QD102和WD Purple SC QD312 Extreme Endurance。第一个包括范围从32到512 GB的四个驱动器,第二个-三种型号,分别用于64、128和256 GB。与消费者解决方案相比,WD Purple已针对当今的数字视频监控系统进行了专门定制,并进行了一些重要的增强。



紫色系列的主要优势是,与家用设备相比,其使用寿命显着延长:QD102系列卡可以承受1000个编程/擦除周期,而QD312-已经具有3000个P / E周期,即使在全天候记录模式下,它们也可以多次延长使用寿命。并使这些卡非常适合在24/7进行记录的受特殊保护的设施中使用。相反,符合UHS Speed 1类和Video Speed 10类,使得WD Purple卡可用于高清摄像机,包括用于实时记录。



此外,WD Purple存储卡还具有许多其他重要功能,值得一提:



  • ( 1 ) ( -25°C +85°C) WD Purple , ;
  • 5000 500 g ;
  • , , .


为了清楚起见,我们为您准备了一个比较表,其中显示了WD Purple存储卡的主要特征。



系列



WD紫色QD102



WD紫色QD312



体积,GB



32



64



128



256



512



64



128



256



形成-



因子



微型SDHC



microSDXC



性能





顺序读取操作的速度高达100 MB / s,



顺序写操作的速度高达65 MB / s



速度类



U1 / V10



记录资源(P / E)





1000





3000



写资源(TBW)





32





64





128





256





512





192





384





768



工作温度范围





-25°C至85°C



保证



3年






All Articles