哈夫曼编码怎么求平均码长度和宽度_求哈夫曼编码的平均码长

2024年 5月 23日上午7:06 • 激活谷笔记

哈夫曼编码怎么求平均码长度和宽度_求哈夫曼编码的平均码长哈夫曼编码哈夫曼编码树首先要知道什么是编码：就像上图一样，左边是编码，右边是字符，所以左边到右边的变换就是解码，右边到左边的变换就是编码。但这是有8位，所以只能表示128位字符，这对英语是够用的了，但是对其他语言例如汉语，日语确实远远不够用，那该怎么办呢？此时就有了多字节编码。但是多字节编码也是有漏

哈夫曼编码
　　哈夫曼编码树

　　首先要知道什么是编码：

　　就像上图一样，左边是编码，右边是字符，所以左边到右边的变换就是解码，右边到左边的变换就是编码。但这是有8位，所以只能表示128位字符，这对英语是够用的了，但是对其他语言例如汉语，日语确实远远不够用，那该怎么办呢？此时就有了多字节编码。

　　但是多字节编码也是有漏洞的，就像是假设我要用多字节编码，但是如果我只输入字符A，那么编码就是00000000 00000000 00000000 01000001，这其实是十分浪费空间的，所以就出现了Unicode。

　　Unicode（编码字符对应表）

　　Unicode本身不是一种编码，而是一个表，对于每个字符都是U+一个16进制数字来表示。这时国际公认的规则，所有由它诞生的编码都是根据它的规则所指定的。例如假设这个字符“x”在这个表中已经规定是这个16进制数，那么进行编码成其他二进制数时这个二进制数的大小一定是等于表中所对应的二进制数的大小的。

　　同时这个统一编码下面分有8为字节编码，16位字节的编码，32位字节的编码。

　　
UTF-8（可变编码）

　　UTF-8是一种变长编码，就是这个编码的长度可以8位8位的依次增长，同时，UTF-8可以根据Unicode编码所对应的16进制数自动转化为对应的二进制数。例如：

我要输出字符B，因为字符B的位数本身就是小于8位的，所以他是可以直接用UTF-8进行编码和解码输出。
我要输出字符“牛”，容易知道字符“牛”是不能直接用UTF-8的八位二进制输出的，所以我可以先将“牛”这个字符在Unicode表中查找到的16进制数找出来，假设这个16进制数所对应的范围是000080-0007FF，那么当他转化为字节流时，UTF-8就会自动变成16位二进制数输出。

　　编码的种类：

　　变长编码：就是像UTF-8这种编码长度可以改变的编码方式。
定长编码：就是像UTF-16这样编码长度已经固定了的编码方式。

　　编码的使用场景

　　信息的传输，因为在信道中，信息是以二进制的方式进行传输的，所以要将信息进行二进制编码，对于不同形式的二进制组合方式，都代表一个不同的信息。

　　平均编码长度

　　平均编码长度的计算方式：平均编码长度 = 每个字符的编码长度*每个字符的出现概率。
意义：平均编码长度越短，说明发送一段相同数据流，所发送的二进制流就越短，发送的效率就越高。

　　哈夫曼树

　　哈夫曼树的生成方式就是利用了平均编码长度这个概念。生成步骤如下：

首先计算出每个字符的生成概率。
这颗树每个叶结点都代表一个字符，同时从根节点和叶结点都代表一个二进制数0或者1.
每要读取一个字符，都是按照左0右1的方式读取出来。

　　假设有数据流中各个字符的出现概率：

　　a: 0.8，b: 0.05，0: 0.1，1: 0.05

　　那么最终形成的树的形状为：

　　那么通过这颗哈夫曼树所得到的哈夫曼编码就是

a : 0
0 : 10
b : 110
1 : 1110

　　可见出现的概率越大的字符所对应的二进制就越长。

　　代码演示：

哈夫曼树怎么画字母的图片_哈夫曼树怎么画字母的图片大全

上一篇 2024年 5月 23日

dl250怎么给手机充电_dl250摩托车有手机充电口吗

下一篇 2024年 5月 23日

激活谷笔记

WebStorm2024.1.5激活码(【2024最新版】PyCharm激活激活成功教程教程（超简单）亲测有效，永久激活)

WebStorm2024.1.5激活码(【2024最新版】PyCharm激活激活成功教程教程（超简单）亲测有效，永久激活)

2024年 7月 1日
rib是什么意思_rib是什么意思英语

rib是什么意思_rib是什么意思英语ribrib的意思、解释过去式：ribbed; 现在分词：ribbing; 复数形式：ribs;rib 基本解释名词肋骨; （船或屋顶等的）肋拱; 肋骨状的东西; （织物的）凸条花纹及物动词嘲笑，逗弄，开（某人的）玩笑; 装肋于，给…装肋材rib什么意思rib 相关例句

激活谷笔记 2024年 5月 27日
激活谷笔记

Rider2024.1.2激活码(Rider2024年最新免费激活码教程)

Rider2024.1.2激活码(Rider2024年最新免费激活码教程)

2024年 7月 2日
激活谷笔记

c语言括号匹配问题利用堆栈_括号匹配问题栈c语言

c语言括号匹配问题利用堆栈_括号匹配问题栈c语言括号匹配（栈） #数据结构与算法（6）今天来作一道题：额！题目的大致意思我用翻译软件翻译了一下是这样的：给定仅包含字符“（”“）”“[”“]”“{”“}”的字符串，请确定输入字符串是否有效。括号必须按正确的顺序闭合，“（）”和“（）[

2024年 6月 17日
Idea激活2023.3.1(IntelliJ IDEA 2023.3.0 Idea2023中文激活版)

Idea激活2023.3.1(IntelliJ IDEA 2023.3.0 Idea2023中文激活版)

激活谷笔记 2024年 6月 23日
Goland激活2023.3.4(IntelliJ IDEA 2023.3.0 Idea2023中文激活版)

Goland激活2023.3.4(IntelliJ IDEA 2023.3.0 Idea2023中文激活版)

激活谷笔记 2024年 6月 25日
存储器主要分为什么和什么_存储器主要分为什么和什么两种

存储器主要分为什么和什么_存储器主要分为什么和什么两种内存储存器分为哪两种内存储器分为两种类型：内存储器和外存储器。内存储器是计算机系统中的主要组成部分之一，也被称为主存或内存。它包括寄存器、高速缓冲存储器以及主存储器。内存储器用于暂时保存CPU中的运算数据，并与外部硬

激活谷笔记 2024年 5月 26日
激活谷笔记

Idea激活2023.2.5(IntelliJ IDEA激活激活成功教程激活码2023最新教程【永久激活，亲测有效】)

Idea激活2023.2.5(IntelliJ IDEA激活激活成功教程激活码2023最新教程【永久激活，亲测有效】)

2024年 6月 25日
线程同步和线程互斥的关系_线程同步和线程互斥的关系图

线程同步和线程互斥的关系_线程同步和线程互斥的关系图互斥锁，同步锁，临界区，互斥量，信号量，自旋锁之间联系是什么？互斥锁：用于保护临界区，确保同一时间只有一个线程访问数据。对共享资源的访问，先对互斥量进行加锁，如果互斥量已经上锁，调用线程会阻塞，直到互斥量被解锁。在完成了对共享资源的访问后，要对互斥量进行解锁。临界区：每个进程中访问

激活谷笔记 2024年 6月 21日
DataSpell激活2024.1.1(หัวข้อ： JetBrains DataSpell 2024.1 Repack by Sitego)

DataSpell激活2024.1.1(หัวข้อ： JetBrains DataSpell 2024.1 Repack by Sitego)

激活谷笔记 2024年 6月 8日
激活谷笔记

Clion激活2023.1.6(IDEA 2023.1.2 激活成功教程安装教程（附最新激活码，亲测有效）)

Clion激活2023.1.6(IDEA 2023.1.2 激活成功教程安装教程（附最新激活码，亲测有效）)

2024年 6月 23日
windows查看pcie版本_windows 查看pcie设备

windows查看pcie版本_windows 查看pcie设备查询 PCI 供应商和设备 ID 以虚拟函数查询虚拟功能的 PCI 供应商和设备标识符项目06/15/2023本文内容注意此方法只能通过覆盖 Hyper-V 父分区的管理操作系统中运行的驱动程序来使用。OID_SRIOV_VF_VENDOR_DE

激活谷笔记 2024年 6月 21日

哈夫曼编码怎么求平均码长度和宽度_求哈夫曼编码的平均码长

相关推荐