找工易简历库共有15个童鞋曾在深圳市优信源科技有限公司工作过目前尚未提供该公司标准面试题和面试流程,如果你知道深圳市优信源科技有限公司是怎么面试的欢迎爆料。
熵(以每个符号的位数表示)平均意味着代表一个原符号所需的位数这里指示原符号和位之间的映射。源编码可以看做是符号和位之间的映射机制对于一串符号,我們如何使用更少的位来表示它们
直觉:使用简短描述来表示最常出现的符号。使用必要的较长描述来表示不经常出现的符号
定义:令x表示源符号,而C(x)表示x的源代码如果C(x)的长度为l(x)(以位为单位),并且x以p(x)的概率发生则源代码C的预期长度L(c)为:
它意味着原编码方案C中表示┅个符号所需的平均位数。
香农信源编码定理:给定一个无记忆信源X
信源符号的明确表示(没有歧义)
可及时译码:定义:对于及时译碼,没有任何的码字相当于其他码字的前缀
我们如何找到最佳的信源编码?
Kraft不等式:对于瞬时码(关于长度为D的字母表)
步骤1:合并两個最小符号功率
步骤2:分配与0和1的两个相应的符号,然后返回到步骤1
重复上述过程,直到将两个概率合并为1
霍夫曼码是最短的前缀碼,即最优码
霍夫曼编码及其预期长度取决于信源向量,即信源的熵
霍夫曼编码可以定义为D进制码。
可以按照二进制结构类似地构造D進制码
步骤1:合并D个最小符号概率。
步骤2:为相应的符号分配0,1,...,D-1然后返回步骤1。
重复上述过程直到将D个概率合并为1。
有可能会创建一個虚拟符号以便最终可以将3个概率合并为一个概率。
最佳D元编码(霍夫曼编码)的属性:
D个最长码字的长度相同
D个最长码字仅在最后┅个符号上有所不同,并且与D个最不可能的原符号相对应