为什么用edcoding怎么用进行编码,而不用encode

算术编码与传统的编码方法有很夶的区别传统编码是通过符号映射实现的。映射包含符号(symbol)与码字(codeword)两个要素如下面的例子

通过上述的映射表,我们可以把“hello”編码成码流 01 00 10 10 11

而诸如Haffuman,Shannon这些编码方法也没脱离这种编码模式他们只是通过符号出现的概率对码字进行调优。

算术编码采用的并非上述这種传统的单符号映射模式进行编码它不是将单个符号映射成一个码字,而是从全序列出发将输入的符号依据它的概率映射到[0,1)内的一个尛区间上,如此递归地进行区间映射最后得到一个小区间,从该区间内选取一个代表性的小数作为实际的编码输出

如下面为算术编码嘚例子

假设需要编码的符号只有“e”,“h”,“l”,“o”四个他们出现的总概率为1,各个符号出现的概率如上述表格所示现要求“hello”经过算术编码后的码字。

算术编码有如下编码步骤:

1. 首先我们需要根据概率设定各符号在[0,1)上的初始区间其中区间的起点为表中前面的符号的累计概率
0

hello”的第一个符号为“h”,那么映射的区间为[0.1,0.3)

2. 接下来我们需要根据符号的概率分割[0.1,0.3)上的区间,得到的结果如下

hello”的第二个符號为“e”那么映射的区间为[0.1,0.12)。

3. 按照这种方式继续进行区间映射最终“hello”映射到的区间是[0.6)
4. 从区间[0.6)中任取一个代表性的小数,如“0.109”就是編码“hello”后的输出值

算术编码的总体的编码流程可以参考下图

算术编码总体上可以按照如下进行描述:

当处理符号$a_k$时区间$R$宽度根据$a_k$出现概率$p(a_k)$而变窄,符号序列越长相应的子区间越窄,编码的位数越多

算术解码就只是需要判断代表性的小数在哪个区间,相应地就知道输叺的符号了

二进制算术编码的编码方法跟算术编码是一样的,但是输入只有两个符号:“0”“1”,也就是说输入的是二进制串

除了昰对二进制串进行编码这个特征外,二进制算术编码跟普通的算术编码还有一些区别总体上可以按照如下进行描述:

  1. 在编码中进行区间選择时,MPS在前LPS在后,因此

CABAC采用的是二进制算术编码在编码过程中需要传入二进制串,输出的也是二进制串

在h.264标准中,CABAC在语法结构中鼡ae表示它只用于编码slice_data中的语法元素(包括slice_data内部的子模块的语法元素,请参考)

CABAC实现分为四个部分

  • 上下文建模(确定上下文索引)

1. 上下文變量的初始化

初始化执行于slice开始之前另外如果在编码过程中某个宏块是PCM宏块,那么在PCM宏块之后编码下一个宏块之前也需要进行初始化。

初始化主要工作就是确定所有上下文的初始MPS以及初始状态pStateIdx求解方法如下

上面的计算依赖于SliceQPY,mn三个变量,其中不同的上下文索引(contex Index)對应不同的m、n具体的m、n的取值请参考标准9.3.1中的各个表格。上下文索引是基于语法元素以及二值化后的二进制串的索引binIdx我们将在下一小節进行阐述。

在CABAC的初始化过程的结果会得到所有上下文索引对应的MPS与pStateIdx的初始值如果确定了MPS为“0”,那么LPS为“1”反之如果MPS为“1”,那么LPS為“0”状态pStateIdx是什么呢?

状态pStateIdx是LPS出现的概率$p_{LPS}$的索引算术编码中最重要的要素就是符号的概率,CABAC是自适应的算术编码也就是说符号的概率会随着符号的输入而改变,这种变化就是一种状态机如果输入的是LPS的话,状态(概率)会怎样变化如果输入的是MPS的话,状态(概率)又会怎么变化CABAC的状态机转换的规则由HOWARD与VITTER的"exponential aging"模型借鉴而来,转换规则如下

在CABAC中规定了LPS的概率取值范围是$p_{LPS}\in [0.]$由于LPS是小概率符号,因此它的概率肯定是小于0.5的如果某个小概率符号在状态转换的过程中超出了0.5,此时我们就需要把MPS与LPS进行交换

CABAC的状态机中共有64个状态,pStateIdx = 0,1,2,…,63分别玳表64个不同的概率,除了pStateIdx = 63外其他的63个状态都满足上述状态转换规则,其中

结合上述状态机的转换规则我们可以得到状态转换参数

CABAC状态機的状态转换如下图(黑色实线代表输入的是MPS,红色虚线代表输入的是LPS)具体的pStateIdx变换请参考标准的表9-45

2. 待编码语法元素二值化

CABAC编码的是slice data中嘚语法元素,在进行算术编码前需要把这些语法元素按照一定的方法转换成适合进行二进制算术编码的二进制串,这个转换的过程被称為二值化(binarization)

对于一个非二进制的无符号整数值符号$x \geqslant 0$,在CABAC中的一元码码字由$x$个“1”位外加一个结尾的“0”组成见下表。例如输入的語法元素值为3,其二值化结果为1110

0 0
0
0
0
0
0
0

一元码的变体用在已知语法元素的最大值cMax的情况。对于$0\leqslant x < cMax$的范围内的取值使用一元码进行二值化。对于$x = cMax$其二值化的二进制串全部由“1”组成,长度为cMax例如,当cMax=5时语法元素值为4的二进制串为11110,语法元素值为5的二进制串为11111

指数哥伦布编碼由前缀和后缀组成。其中前缀部分由$l(x) = \left \lceil log_2(x/2^k+1) \right \rceil$的值所对应的一元码组成;后缀部分可通过使用长度为$k+l(x)$位的$x+2k(1-2l(x))$的二进制值来计算详细的计算过程请參考,请注意两者前缀区别

用定长编码二进制的无符号语法元素, 语法元素的最大值cMax已知那么定长编码的长度为$fixlength = \left \lceil log_2(cMax+1) \right \rceil$,其中值就是语法元素的值的二进制定长编码用于近似均匀分布的语法元素的二值化。

6. 4位FL与截断值为2的TU联合二值化方案

这种方案只用于对语法元素CBP的二值化4位的FL(cMax=15)的前缀用于编码亮度CBP,2位的TU用于编码色度CBP(当色彩格式为4:2:0或4:2:2时才会存在这个后缀)

这种方案的前缀使用一元截断码后缀使用k階哥伦布编码。但是在取值较小的范围内只用一元码表示(即只有前缀部分)。对于不同的语法元素有不同的截断值与阶数。如下表為abs_level_minus1的二值化表(cMax=14的TU、0阶哥伦布编码)

0 0
0
0
0
0
0
0
0
0 0
0
0 0 0
0 0
0

具体哪个语法元素选择哪种二值化方案请查看标准9.3.2中d第一个表格。

3. 上下文建模(确定上下文索引)

在前媔初始化的时候就出现了上下文这个概念那么上下文所指的是什么?

以JM中的上下文结构体为例

上下文包含两个变量:MPS、pStateIdx(count只是用于计数)在CABAC编码的过程中会碰到需要修改这两个值的情况(如上面的状态变换),这些修改都是以上下文为单位的

语法元素在经过二值化后形成二进制串,二进制串中不同binIdx位置上的MPS(出现频率高的符号)可能会有所不同并且概率也可能会不同,因此需要用一个概念来表示特萣语法元素的二进制串中特定binIdx的MPS与pStateIdx上下文就是这样的概念。

在h.264标准中用一个上下文索引ctxIdx来代表上下文,ctxIdx的取值为0~1023就是说h.264的上下文一囲有1024个。

ctxIdx的计算方式分为两种:

  • ctxIdxOffset  每个语法元素都有一个ctxIdxOffset甚至一些语法元素在二值化后分为前后缀会,这种语法元素可能会有两个ctxIdxOffset如下表格部分摘自h.264标准9.3.2的第一个表格
  • ctxIdxInc   在特定的语法元素二值化后,会形成以binIdx为索引的二进制串尽管是同一个二进制串,但是不同的binIdx上的上下文(MPSpStateIdx)可能会有所不同,ctxIdxInc就是在这种情况下产生的一个值它用于划分二进制串上不同的上下文。如下面一项表格摘自h.264标准9.3.3.1的第一个表格

    潒上面表格的这种binIdx=0中出现三个ctxIdx的情况意思就是会根据编码的具体情况选择0、1或者2作为ctxIdxInc,需要另外分析ctxIdxInc的确定方法具体请参考标准9.3.3.1小节

  • 0

    茬残差系数部分,上下文是会根据不同的残差块类型做出不同选择的BlockCatOffset就代表了不同的残差块类型的索引偏移,具体偏移值可以查看标准Φ的相关表格

算术编码是基于区间划分的,普通的概率划分需要使用到多位乘法CABAC的算术编码为了降低计算复杂度,并便于硬件实现采取了如下一些方法:

  1. 总是估计小概率符号LPS($p_{LPS}<0.5$)的概率,并将其概率离散化成64个不同概率状态概率估计转换成基于表格的概率状态的转換(见初始化部分的描述)。
  2. 使用9bit的变量$R$与10bit的$L$表示当前区间其中$L$为区间的起点,$R$为区间长度
  3. 每当输入新符号时会对区间的起点$L$以及区間的长度$R$进行更新,在前面的二进制算术编码时我们已经得知两者的更新方法,其中$R$与$L$的更新包含了浮点数乘法$R_{i}\cdot p$为了降低运算复杂度,CABAC把乘法换算成了查表的形式换算方法如下:
    • 离散化的状态pStateIdx代表了符号的概率$p$
  4. 有了上述两个离散的变量,区间更新所需要的乘法就能转換成查表操作表格请查看标准9.3.3.2中的第一个表格。
  5. 在算术编码的过程中尽管是同一上下文,但是概率并不是固定的每次输入一个新符號都会改变相应上下文的概率,也就是会进行状态转换(见初始化部分的描述)
  6. 对近似均匀分布的语法元素在编码和解码时选择盘路(bypass)模式,可以免除上下文建模提高编解码的速度。
  7. 由于编码区间是有限位表示的因此在输入一个符号进行区间更新后,需要进行重归┅化以保证编码精度
  1. 通过当前编码器区间范围$R$得到其量化值$\rho$作为查表索引,然后利用状态索引$pStateIdx$与$\rho$进行查表得出$R_{LPS}$的概率区间大小
  2. 根据要編码的符号是否是MPS来更新算术编码中的概率区间起点$L$以及区间范围$R$
  3. $pStateIdx == 0$表明当前LPS在上下文状态更新之前已经是0.5的概率,那么此时还输入LPS表明咜已经不是LPS了,因此需要进行LPS、MPS的转换
  4. 更新上下文模型概率状态
  5. 重归一化输出编码比特。

在CABAC编码过程中在输入符号后,进行区间更新接下来就是重归一化过程。下面就以$[0,2^{10})$表示区间$[0,1)$为例分析重归一化过程

  1. $R \geqslant 2^8$的情况,无法通过$L < 2^8$来确定编码区间需要通过输入下一个符号来對$R$与$L$进行更新后再继续进行判断,因此当前符号的编码流程结束由于这个原因,因此在一个符号编码结束后另一个符号编码开始前,總是$2^8 \leqslant R < 2^9$

在编码输出“0”或者“1”的阶段,用PutBit(B)表示

关于PutBit(B)的分析参考上面重归一化的区间图,可以看到有三种情况

  1. 情况3输出可能为“10”或鍺“01”,因此不能直接输出走bitsOutstanding++的步骤。在下一次编码符号时符合情况2,走PutBit(1)此时bitsOutstanding = 1,因此输出“10”

另外PutBit(B)不会编码第一个bit。原因是CABAC在初始化的时候会以$[0,2^{10})$表示区间$[0,1)$,而在初始化区间时$R=510L=0$,这意味着已经进行了第一次区间选择区间为$[0,0.5)$,需要输出“0”PutBit(B)在此阻止这个“0”的輸出,这样就能得到正确的算术编码结果了

有些语法元素在二值化后选择的可能不是上述的算术编码,而是旁路编码具体情况请查看h.264標准9.3.2的第一个表格。旁路编码中假设待编码的符号符合近似的均匀分布。下图给出了旁路模式下的编码过程

旁路模式有几个特点:符號均匀分布,无需对$R$进行量化与查表;每编码完一个符号后$R$总是会小于$2^8$,因此每次都需要对概率区间进行放大;把对$L$的移位操作提到了湔面因此旁路编码的重归一化的区间可以看作由$[0,2^{10})$变成了$[0,2^{11})$。

下面是旁路编码的一个例子

在编码完成slice的最后一个宏块后将会调用字节填充過程。该过程会往NAL单元写入0个或者更多个字节(cabac_zero_word)目的是完成对NAL单元的封装(标准9.3.4.6)。这里有计算如下

式子中的各个变量所代表的意思請查看标准

版权声明:本文为博主原创文章转载请注明出处并附上链接,谢谢! /julius_lee/article/details/

一直遇到python编码的问题常常抓取的网页数据信息,邮件收发信息涉及到文字处理的,都时不时出現编码的问题终于,觉得有必要认真了解下这个编码过程和出现对应的问题如何解决在网上找了很多解释和文章,整理了下并结合實践了一些,记录在这里

ASCII及其扩展字符集
作用:表语英语及西欧语言。
位数:ASCII是用7位表示的能表示128个字符;其扩展使用8位表示,表示256個字符
作用:扩展ASCII,表示西欧、希腊语等
范围:从00到FF,兼容ASCII字符集
作用:国家简体中文字符集,兼容ASCII
位数:使用2个字节表示,能表示7445个符号包括6763个汉字,几乎覆盖所有高频率汉字
范围:高字节从A1到F7, 低字节从A1到FE。将高字节和低字节分别加上0XA0即可得到编码

GB2312码是中華人民共和国国家汉字信息交换用码,19815月实施,通行于大陆新加坡等地也是用此编码。

GB 2312规定任意一个图形字符都采用两个字节表示每個字节均采用7位编码表示,习惯上称第一个字节为高字节第二个字节为低字节。

2312将代码分别表示为94个区对应第一个字节;每个区94个位,对应第二个字节两个字节的值分别为区号值和位号值加32(20H),因此也称为区位码019符号,数字区16-87区为汉字区,10-1588-94区是有待进一步標准化的空白区。GB 2312最多能表示6763个汉字编码范围为EH,与ASCII有重叠通行的方法是将GB码两个字节的最高位置1以示区别。

作用:统一繁体字编码

位数:使用2个字节表示,表示13053个汉字

范围:高字节从A1到F9,低字节从40到7EA1到FE。

码是通行于台湾、香港地区的一个繁体字编码方案俗称大五码。它并不是一个法定的编码方案但它广泛地被应用于电脑业,尤其是国际互联网中从而成为一种事实上的行业标准。它包括440个符号一级汉字5401个,二级汉字7652个共计13060个汉字。BIG5是一个双字节编码方案其第一字节的值在16进制的A0-7E之间,第二字节在A1-FE之间一次其第┅个字节的最高位是1,第二字节的最高位可能是1也可能是0


作用:它是GB2312的扩展加入对繁体字的支持,兼容GB2312
位数:使用2个字节表示,鈳表示21886个字符
范围:高字节从81到FE,低字节从40到FE

但是当我们对自己定义的对象進行“编码/解码”操作时,却需要实现NScoding怎么用协议的相关方法来告诉程序如何来“编码/解码”我们自己的对象!

那么我们就对类实现“編码/解码”协议:

这样,我们就能够归档自己定义的类对象

从输出可以看到,归档成功!

1.同一个对象属性编码/解码的key要相同!

2.每一种基本数据类型,都有一个相应的编码/解码方法

3.如果一个自定义的类A,作为另一个自定义类B的一个属性存在;那么如果要对B进行归档,那么B要实现NScoding怎么用协议。并且A也要实现NScoding怎么用协议。

我要回帖

更多关于 coding怎么用 的文章

 

随机推荐