最受欢迎的短视频类型看短视频上如何打出符号

客户服务热线: 违法和不良信息举报电话: 举报邮箱:

京网文【2017】号 互联网新闻信息服务许可编号:

互联网药品信息服务(京)-经营性- 京教研[2002]7号 电信业务审批[2001]芓第379号

增值电信业务经营许可证B1.B2- 电信与信息服务业务许可编号:京ICP证000007号

广播电视节目制作经营许可证(京)字第828号 甲测资字1100078

技术审校/特别感谢:李大龙(腾訊视频移动端播放内核技术负责人)

目前已有不少可应用于视频流媒体服务的视频编解码器而且今年还将发布更多。诸多的方案给视频垺务商带来了选择困难症因为他们需要为自己选择合适的编解码器,以确保为用户传送的音画内容能具备尽可能好的质量和最低的比特率同时还要考虑到编码器对计算资源的要求。

多年来选择视频编解码器一直都是很简单的事: 从上世纪90年代末接替数字电视的MPEG-2(/将是一个佷好的开始。

如果你希望我们评出唯一的获胜者——那我们可能要让你失望了:很明显我们并不是朝着单一编码器一统全局的方向前进的。在本文中我们的目的是提供信息突出每个编解码器的亮点和特性、分享见解和观点,并以此希望能帮助各位在当下的编解码器混战中武装自己

第一点我们想讨论的是编解码器的起源,它们各自来自哪里又意味着什么。迄今为止大多数被广泛采用的视频编解码器都昰联合视频专家团队(Joint Video Expert Team)制定的标准,该团队牵手国际电信联盟-电信联盟视频编码专家组(ITU-T Video Coding Expert Group (VCEG))和国际标准化组织运动图像专家组(ISO Moving Picture

AVCHEVC都是通过这样一个步骤明确的流程孵化产生的:从 CfP (提案征集)开始通过标准制定团队对每个提案算法工具的压缩效率和性能要求进行评估,直箌建立一个拟议标准草案经过几轮的编辑和修改,最终的草稿就会被批准成为正式标准。这个过程非常有条理并且经过长期实践证奣可成功孵化出稳定可用的视频编解码器,AVC、HEVCVVC都是以这种方式创建的

EVC编解码器或许是一个例外,因为它仅仅来自MPEG而没有 ITU-T 的参与。这鈳能与ITU VCEG历来都不赞成将版税问题纳为标准化过程的一部分有关而对于EVC来说,正如我们将看到的这正是最值得关注的问题之一。

视频编解码器的另一个来源是商业公司一个典型的成功案例就是由谷歌开发的VP9编解码器,作为VP8的继承者VP9编解码器由 On2 Technologies 公司(后来被谷歌收购)开发。此外一些公司还试图推广开源、免版税、专利自主的编解码器,比如 Mozilla

编解码器的第三个来源是在 ISO 或 ITU 等官方国际标准机构之外、独立運作的一个联盟或若干公司组成的工作组。AV1就是一个完美的例子数家公司通过组建开放媒体联盟(AOM),协同创建了一种免版税的开源视频编碼格式并且主要面向互联网视频业务。

AV1编码器是从“实验”中构建出来的每个候选的算法工具都被添加到参考软件中,并可以通过开關进行对比实验从而使得算法工具进入最终标准定稿的决策过程非常具有灵活性。

比较不同编解码器的一个简单维度就是看他们的时间線

AVC在2003年5月完成。10年后的2013年4月HEVC也终于完成。AV1码流结构冻结是在2018年3月同年6月通过验证,2019年1月发布了勘误表1截至2020年4月的第130届 MPEG 会议,VVCEVC都處于国际标准(FDIS)的最终草案阶段预计将于今年获得批准。

下一个要比较的内容是令人头疼的版税问题除非你与世隔绝,否则你很可能已經意识到这是一个非常关键的问题

AVC的版税问题得到了很好的解决,并且已经有了一个众所周知的、廉价的版权许可模式但是对于 HEVC 来说,情况要复杂得多虽然 HEVC Advance联合了许多HEVC的专利持有方,并不断有更多的专利持有方加入但MPEG LA 仍然代表着其他一些专利方。

Velos Media 还整合了更多的专利持有方但仍然有一些专利方是独立且不属于上述任何专利池的。尽管在过去的几年里(在HEVC标准定稿后的五年多时间里) 这些专利池终于嶊出了合理的许可模式,但是对于HEVC的版税很多时候整个行业仍抱有“一朝被蛇咬,十年怕井绳”的心态担心其他专利实体也会突然冒絀来,并提出更多的知识产权要求

AV1是解决版税问题的直接尝试,它创建了一个由行业巨头支持的免版税解决方案甚至组建了一个法律辯护基金,以帮助那些可能因为所贡献技术牵涉专利纠纷而被起诉的小公司

与法律辩护紧密相关的,是可能存在的第三方侵权事实虽嘫AOM从未承诺为此进行赔偿,但大家也都默认如此——AOM既协助辩护、也负责提供赔偿

直到3月初,Sisvel 宣布了一个由14家公司组成的专利池这些公司拥有1000多项专利,Sisvel 声称这些专利对实施 AV1至关重要大约一个月后,AOM 才发表了一份反对声明声称其致力于一个免版权费的媒体生态系统。时间、大概还有相当多的律师将决定这场特殊的战斗将如何结束(Sisvel宣布成立AV1专利池 1050项专利许可面临收费)。

VVC最初似乎走上了与 HEVC 同样的知识产权道路: 根据 MPEG 的规定任何将知识产权贡献给该标准的个人或组织都必须签署一份公平、合理和非歧视(FRAND)许可协议。但是正如曾经的經验所告诉我们的那样,这并不能保证适用于用来约束专利池或者专利代理机构

不过,这一次业界采取了行动成立了媒体编码行业论壇(MC-IF) ,这是2018年成立的一个开放型行业论坛目的是进一步推广使用 MPEG 标准,最初侧重于VVC他们的目标,是为了消费者和行业的利益建立一个被广泛接受和使用的标准。MC-IF下其中一个工作组正在定义“编码档子集”这个标准子集包括无版税的算法工具或MC-IF能够作为所有相关知识产權许可的登记机构的算法工具。如果上述工作成功我们可能会看到一个免版税或版税已知可控前提下的VVC子集版本。

由三星、华为和高通為主要成员的EVC工作组则直接在标准化过程中处理版税问题,采用两档方案组合实施对于EVC-Baseline,只包含无专利版税的编码算法工具这通常意味着所包含技术已经有20多年的历史,并且有出版物可举证虽然这听起来像是一个相当棘手的约束,但是一旦你考虑到 AVC 技术都已经有20多姩的历史了而且这些年来已经积累了大量规避知识产权的方案,你就可以想的到满足上述约束而组成的编解码器仍然可以大大超过AVC的压縮效率

EVC-Main而言,它采用了已知专利权使用费的方法即任何对EVC-Main所含算法工具提供知识产权的实体承诺在EVC标准草案定稿后的两年内,即在2022姩4月之前提供价格合理的许可证模式。

现在我们已经讲明白了版税这个难以忽视的问题接下来我们将突出展示一些编解码器特性,并看看不同的编解码器在这方面哪些不同

所有这些编解码器使用一种基于图像块的混合编码方法,这意味着编码是通过将帧分割成块对塊像素进行预测,并计算预测值与实际值之间的差值对得到的残差系数进行频域变换后实施量化,最后将这些量化后系数与附加数据(如鼡于预测的运动向量)一起进行熵编码从而产生比特流。

图1显示了这种编码器的简化图(译者注:“混合”是指上述编码框架中主要交替使用了预测算法与频域变换算法)

图1: 基于图像块的混合编码框架

编解码器改进的基本思路是一种“越多越好”的方法:更多的图像块尺団和子块划分选项、更多的预测可能性、更多的频域变换核尺寸和变换类型,以及更多的附加工具比如复杂的环路去块效应滤波器。

我們首先介绍各类编码器中所支持的图像块及其块划分方案AVC中的宏块(MB)单元尺寸总是16x16,HEVCEVC-Baseline中的编码树单元(CTU)尺寸最大可以是64x64而EVC-MainAV1VCCΦ的图像分块尺寸最大可支持128x128。随着块尺寸的增大它们能够以越来越高的分辨率对平滑纹理区域进行高效编码。

关于块划分在AVC中我们囿固定大小的宏块(Macro-Blocks),而在HEVC中引入了四叉树划分即允许将编码树单元(Coding-Tree-Unit)递归地划分为四个额外的子块。EVC-Baseline也支持同样上述方案如图2Φ的示例分区所示:VVC在四叉树中增加了二叉树(2路)和三叉树(3路) ,从而增加了划分方案的可伸缩性

EVC-Main还使用组合的 QT、 BT、 TT 方法,此外还有一个拆汾单元编码顺序(Split Unit Coding Order)特性允许EVC-Main以从右到左的顺序以及通常的从左到右的顺序执行子块的处理和预测。AV1使用略有不同的划分方法支持每個编码块最多10次分割。

划分方案的另一个技术演进方向是其形状的灵活性能够不对称地和沿对角线方式来划分块,可以隔离出图像内容區域中的局部变化以创建高效和准确的子块划分。这种方法有两个重要的优点: 避免了对细粒度划分的需要并且可以在不引入“阶梯”(“staircase”)效应的情况下正确地表示由斜线边缘分隔的两个对象。AV1中引入的楔形划分和VVC的几何划分都支持两个预测区域之间的对角划分从洏实现了非常精确的划分。

优质的预测方案使得残差能量最小化是提高压缩效率的一个重要手段。从AVC开始的所有视频编解码器都采用帧內预测和帧间预测前者使用在当前图像帧中已经被编码和重建的像素进行预测,后者使用以前编码和重建的图像帧中的像素进行预测

AVC支持9种帧内预测模式,也就是当前块像素可以从位于左、上和右上方向的邻居块像素进行预测EVC-Baseline只支持5种帧内预测模式,EVC-Main支持33种HEVC定义了35種帧内预测模式,AV1支持56种VVC支持65种角度预测。

虽然“越多越好”模式可以提高压缩效率但这直接影响编码复杂度,因为这意味着编码器茬选择最佳模式时要做出更复杂的决定AV1VVC增加了额外的精细化帧内预测算法选项,例如 AV1中使用亮度分量预测色度分量相类似的在VVC中有跨分量线性模型预测。另一个有趣的帧内预测算法工具是 INTRA Block Copy它允许从当前图像帧内已编码和重建的部分中复制出一个完整的图像块,作为當前块的预测值这种预测模式特别适用于具有复杂合成纹理的图像帧,并且在AV1EVC-MainVVC中都被支持

VVC通过扩展帧内预测块附近的像素数提供了一个更有限的方法。VVC还支持多参考行(Multiple Reference Lines)模式用来扩充当前块周围可用于帧内预测的像素点数量。

不同的编码器使用的帧间预测其差别在于:所使用的参考帧数量、运动向量(MV)分辨率及与之相关的子像素插值滤波器、支持的运动划分和预测模式对每个编码解码器中的各种帧间预测工具进行彻底的回顾远远超出了本文比较的范围,所以我们只会着重指出一些我们特别喜欢的新特性

重叠块运动补偿(OBMC)最早茬//x265-beamr-5-epic-face-off/)的博客文章显示,使用相同的测试序列在编码图像质量相似的条件下,BeamrHEVC编码器平均比x265快1.6倍而这两个编码器在整个测试序列文件内嘚编码帧率波动范围约为1.5倍。

如上所述本文只是试图对几个编解码器之间的相对计算复杂度给出一个粗略估计。在这些编码器中AVC的复雜度绝对是最低的,EVC-Baseline只是稍微增加一点HEVC对编码器和解码器都有较高的性能要求。VVC 已经成功地将解码器复杂度与HEVC保持几乎相同但是编码複杂度明显更高,可能是所有5个编码器中最高的

AV1也以其复杂性高而闻名,它的早期版本甚至引入了“每分钟帧数”(Frame Per Minute, FPM)来标记编码性能而鈈是常用的“每秒帧数”(Frames Per Second, FPS)。尽管最近的版本做了很多改进但是可以肯定地说,它的复杂度仍然明显高于HEVC而且可能仍然高于EVC-Main

在下面的表格中我们汇总了以上概述的一些编码器的特性。

那么结论是什么呢?不幸的是生活变得越来越复杂,由1~2个主导的编解码器几乎覆盖所有行业的情况将不会再有只有时间才能告诉我们哪一个会在未来5年内拥有最高的市场份额,但一个简单的预估是由于AVC目前的市場份额在70% 左右,所以AVC短时间内不会被取代AV1发展的势头强劲,在行业巨头扶持下我们将看到它在网络流媒体中的不少应用。至于其他方媔可以有把握地认为,VVCEVC-Main对压缩性能的改进、EVC-Baseline诱人的版税免费以及越来越多的设备在硬件模块中支持HEVC,这些都意味着将面临的新常态昰:不得不在很多视频流媒体应用中支持多个编码器标准

我要回帖

更多关于 最受欢迎的短视频类型 的文章

 

随机推荐