尽量降低视频码率又不影响视频的主观观看质量,这是视频平台最关心的问题之一,因为降低码率意味着视频播放带宽的下降,节约成本。
2018年3月,又拍云自研的“窄带高清”功能,通过码率控制优化,让视频在主观质量不受影响的情况下,高效降低30%视频码率。窄带高清通过视频内容复杂度算法来确定视频应用场景,继而确定该场景下最优视频编码参数,辅助于码率控制算法,最终达到视频码率控制与带宽优化这个目的。
窄带高清可以有效提升视频播放平台终端用户视频打开速度,并且减少视频分发在带宽成本的上的消耗。
为什么窄带高清可以节省流量
一般来说,视频转码所需的成本比视频播放带宽少很多。因此通过视频转码来降低带宽成本成为可能,窄带高清就是建立在这个大前提下的一个功能。通过窄带高清功能可以节省30%的视频码率,大大降低直播、点播等业务场景下的带宽成本。
窄带高清是如何实现
实现窄带高清有两个优化方向,1.在相同码率的情况下提升视频质量;2.在主观质量不受损失的情况下,尽可能降低视频码率。
根据实际业务需求,又拍云的“窄带高清”功能采用了第二种思路,即保持视频质量,降低码率。
场景划分
首先我们需要对视频进行内容复杂度分析,获取场景信息,取得视频空间域的复杂度和时间域的复杂度,然后获得视频序列最终的复杂度,最终确定视频编码场景。
为什么要进行场景划分呢?
下文我们以场景运动剧烈和平缓的视频为例,跟大家解释一下场景划分的原因。
从上图可以看出,在相同质量下,场景运动缓慢的视频比场景运动剧烈的视频,所需码率少很多,这就是场景划分的意义所在。
目前我们对手机拍摄视频、动画、商业动作大片、影视剧、在线教育、综艺节目等视频场景进行测试,获取常见场景下视频内容的编码复杂度。
另外在高码率的时候,码率增加对视频质量的提升比较少,因此只要找到合适码率,那么视频低码率下的质量和高码率下的质量是相差无几的,这是窄带高清的理论基石。
码率控制算法研究
码率控制算法是视频编码器中非常重要的部分,学术上,码率控制算法分为两种:CBR(Constant Bit Rate,恒定码率)和VBR(Variable Bit Rate,可变码率)。考虑到业务需求是在主观质量不变的情况下,降低视频文件大小,又拍云“窄带高清”功能采用VBR的方式,并做了如下设定提升整体画质的表现:
- 视频运动缓慢的时候,使用更低的码率;运动剧烈的时候,使用更高的码率;
- 视频图像内部,静止的部分分配更少的码率;运动的部分分配更多的码率。
通俗的说,把码率放在该用的地方,不浪费每一个比特,实现更低的码率,更清晰的画质,更小的文件尺寸。
视频编码器优化
如何对视频编码器进行优化,又拍云通过客观质量评价加主观质量评价想结合的办法来制定视频编码器优化标准。
视频质量评价作为视频领域热门的研究方向之一,分成主观质量评价和客观质量评价两类。
主观质量评价,即通过人工观察者直接观察视频,在主观打分,对视频质量的好坏进行分级,该方法必须严格的测试环境实施步骤复杂,而且对观察者要有一定的专业要求,因此实施起来需要巨大的代价,一般会用在科研机构小规模的算法验证。
而对海量视频数据和工业界来说,客观质量评价是更好的选择。PSNR(Peak Signal to Noise Ratio,峰值信噪比),是基于数学统计特性的评价方法,基于独立的像素差值,忽略序列内容对失真可见度的影响,因而会出现和主观感知的视频质量的一致性存在差异。但是算法简单,易于操作,且大规模应用。
针对PSNR的缺点,Zhou Wang等人实现了亮度、对比度和结构失真相互独立的质量评价方法SSIM,得到更接近人眼视觉特性的评价指标。但是依然是过于简单,屏蔽掉了HVS的其他生理特性。
视频编码器的参数数量很多,纷繁复杂,为了得到最佳的优化组合,我们用了客观质量评价算法PSNR(Peak Signal to Noise Ratio,峰值信噪比)和SSIM(Structural SIMilarity,结构相似度),主观质量评价算法VMAF(Video Multi-Method Assessment Fusion),再配合人工主观质量评价的方式,获取了常见场景下视频编码器的参数优化方案。
又拍云窄带高清,融合了以上几种客观和主观的评价方法,在编码器优化过程中,获取码率和视频质量的平衡。
目前,绝大多数视频还是使用H.264/AVC视频编码标准,更先进的H.265/HEVC和VP9的普及度还不够。因此又拍云“窄带高清”功能优先支持了H.264视频编码格式,未来将支持H.265格式。
学术界还有许多码率方面的研究成果,比如基于ROI(Region of Interest,感兴趣区域)和HVS(Human Visual System,人眼视觉系统)的码率控制,这些成果和技术,又拍云也将积极融入到相关产品和解决方案中。
推荐阅读: