哈夫曼树平均码长的计算_哈夫曼树平均码长的计算公式

2024年 5月 21日下午6:21 • 激活谷笔记

哈夫曼树平均码长的计算_哈夫曼树平均码长的计算公式哈夫曼编码哈夫曼编码树首先要知道什么是编码：就像上图一样，左边是编码，右边是字符，所以左边到右边的变换就是解码，右边到左边的变换就是编码。但这是有8位，所以只能表示128位字符，这对英语是够用的了，但

哈夫曼编码
　　哈夫曼编码树

　　首先要知道什么是编码：

　　就像上图一样，左边是编码，右边是字符，所以左边到右边的变换就是解码，右边到左边的变换就是编码。但这是有8位，所以只能表示128位字符，这对英语是够用的了，但是对其他语言例如汉语，日语确实远远不够用，那该怎么办呢？此时就有了多字节编码。

　　但是多字节编码也是有漏洞的，就像是假设我要用多字节编码，但是如果我只输入字符A，那么编码就是00000000 00000000 00000000 01000001，这其实是十分浪费空间的，所以就出现了Unicode。

　　Unicode（编码字符对应表）

　　Unicode本身不是一种编码，而是一个表，对于每个字符都是U+一个16进制数字来表示。这时国际公认的规则，所有由它诞生的编码都是根据它的规则所指定的。例如假设这个字符“x”在这个表中已经规定是这个16进制数，那么进行编码成其他二进制数时这个二进制数的大小一定是等于表中所对应的二进制数的大小的。

　　同时这个统一编码下面分有8为字节编码，16位字节的编码，32位字节的编码。

　　
UTF-8（可变编码）

　　UTF-8是一种变长编码，就是这个编码的长度可以8位8位的依次增长，同时，UTF-8可以根据Unicode编码所对应的16进制数自动转化为对应的二进制数。例如：

我要输出字符B，因为字符B的位数本身就是小于8位的，所以他是可以直接用UTF-8进行编码和解码输出。
我要输出字符“牛”，容易知道字符“牛”是不能直接用UTF-8的八位二进制输出的，所以我可以先将“牛”这个字符在Unicode表中查找到的16进制数找出来，假设这个16进制数所对应的范围是000080-0007FF，那么当他转化为字节流时，UTF-8就会自动变成16位二进制数输出。

　　编码的种类：

　　变长编码：就是像UTF-8这种编码长度可以改变的编码方式。
定长编码：就是像UTF-16这样编码长度已经固定了的编码方式。

　　编码的使用场景

　　信息的传输，因为在信道中，信息是以二进制的方式进行传输的，所以要将信息进行二进制编码，对于不同形式的二进制组合方式，都代表一个不同的信息。

　　平均编码长度

　　平均编码长度的计算方式：平均编码长度 = 每个字符的编码长度*每个字符的出现概率。
意义：平均编码长度越短，说明发送一段相同数据流，所发送的二进制流就越短，发送的效率就越高。

　　哈夫曼树

　　哈夫曼树的生成方式就是利用了平均编码长度这个概念。生成步骤如下：

首先计算出每个字符的生成概率。
这颗树每个叶结点都代表一个字符，同时从根节点和叶结点都代表一个二进制数0或者1.
每要读取一个字符，都是按照左0右1的方式读取出来。

　　假设有数据流中各个字符的出现概率：

　　a: 0.8，b: 0.05，0: 0.1，1: 0.05

　　那么最终形成的树的形状为：

　　那么通过这颗哈夫曼树所得到的哈夫曼编码就是

a : 0
0 : 10
b : 110
1 : 1110

　　可见出现的概率越大的字符所对应的二进制就越长。

　　代码演示：

二叉排序树的基本性质_二叉排序树的定义和特性

上一篇 2024年 5月 21日下午6:16

分区表修复器怎么使用的_分区表修复器怎么使用的啊

下一篇 2024年 5月 21日下午6:28

激活谷笔记

黑客零基础入门教程及方法，从零开始学习黑客技术，看这一篇就够了

黑客零基础入门教程及方法，从零开始学习黑客技术，看这一篇就够了

2024年 6月 28日
p.r是什么意思_pr是什么意思的缩写

p.r是什么意思_pr是什么意思的缩写采购里面PR，PO是什么意思，什么英文缩写PO : 订单(Purchase order)PR : 采购申请Purchase Reques拓展资料其它企业管理用词bai缩写1、ERP : 企业资源规划 (Enterprise Resource Planning)2、FAE : 应用

激活谷笔记 2024年 5月 21日
激活谷笔记

china设计logo_china设计字体

china设计logo_china设计字体LOGO设计：中国船舶集团全新LOGO设计近期，中国船舶集团举行新LOGO设计发布仪式。向海图强、开放包容，新LOGO的问世展现中国船舶集团打造世界一流船舶品牌的雄心，凝聚了中国船舶人的热盼与追求。➤大型船舶中国船舶集团是经国务院批准，于2019年10月14日由原

2024年 5月 26日
激活谷笔记

Datagrip激活2023.1.2(DataGrip2023安装激活最新教程（附工具及激活码）)

Datagrip激活2023.1.2(DataGrip2023安装激活最新教程（附工具及激活码）)

2024年 6月 24日
位置索引图是什么意思呀_位置索引图是什么意思呀怎么画

位置索引图是什么意思呀_位置索引图是什么意思呀怎么画引出线，指北针，风玫瑰，索引、详图、对称符号是什么东西？一、索引符号（一）索引符号的标注位置图中需要另画详图表示局部构造时，在图中适当位置标出索引符号。（二）索引符号的绘制方法索引符号由直径10mm的圆和水平直

激活谷笔记 2024年 5月 29日
激活谷笔记

oracle中的分析函数和开窗函数_oracle开窗函数取最大值

oracle中的分析函数和开窗函数_oracle开窗函数取最大值Oracle 分析函数_开窗函数详解Oracle分析函数是Oracle系统自带函数中的一种，是Oracle专门用来解决具有复杂统计需求的函数，它可以对数据进行分组然后基于组中数据进行分析统计，最后在每组数据集中的每一行中返回这个统计值。Ora

2024年 6月 18日
激活谷笔记

二叉搜索树的查找操作的平均时间复杂度是_二叉搜索树的平均时间复杂度为

二叉搜索树的查找操作的平均时间复杂度是_二叉搜索树的平均时间复杂度为最全二叉树：完整详解二叉树的遍历以及完全二叉树等6种二叉树树在数据结构中占据了非常重要的位置，尤其是二叉树。经常是在java面试中必问的一个环节，而且二叉树的应用场景真的非常普遍，需要重点掌握好。但是一直以来，很多同学对于二叉树的掌握都是不太全面。今天我就来谈谈二叉树，

2024年 6月 21日
激活谷笔记

Idea激活2024.1.4(IntelliJ IDEA 2024.1.2 激活码激活成功教程工具和教程永久激活成功教程（全家桶激活）)

Idea激活2024.1.4(IntelliJ IDEA 2024.1.2 激活码激活成功教程工具和教程永久激活成功教程（全家桶激活）)

2024年 6月 28日
激活谷笔记

malloc函数菜鸟教程_malloc函数的用法格式

malloc函数菜鸟教程_malloc函数的用法格式malloc函数详解谈到malloc函数相信学过c语言的人都很熟悉，但是malloc底层到底做了什么又有多少人知道。1、关于malloc相关的几个函数关于malloc我们进入Linux man一下就会得到如下结果：也可以

2024年 5月 23日
激活谷笔记

Navicat Premium 17.0.8激活(Navicat Premium 15.0.17 —– (安装+注册+注册机))

Navicat Premium 17.0.8激活(Navicat Premium 15.0.17 —– (安装+注册+注册机))

2024年 6月 9日
激活谷笔记

Datagrip激活2024.1.3(PyCharm 2024.1.2 最新激活码,激活成功教程版安装教程（亲测有效~）)

Datagrip激活2024.1.3(PyCharm 2024.1.2 最新激活码,激活成功教程版安装教程（亲测有效~）)

2024年 6月 11日
DataSpell激活2024.1.3(PyCharm 2024.1.1 最新激活码永久激活成功教程教程免费教程（长期更新免费工具）)

DataSpell激活2024.1.3(PyCharm 2024.1.1 最新激活码永久激活成功教程教程免费教程（长期更新免费工具）)

激活谷笔记 2024年 6月 30日

哈夫曼树平均码长的计算_哈夫曼树平均码长的计算公式

相关推荐