当前位置:软件学习 > 其它软件 >>

算法系列15天速成——第十三天 树操作【下】

 

今天说下最后一种树,大家可否知道,文件压缩程序里面的核心结构,核心算法是什么?或许你知道,他就运用了赫夫曼树。

听说赫夫曼胜过了他的导师,被认为”青出于蓝而胜于蓝“,这句话也是我比较欣赏的,嘻嘻。

 

一  概念

    了解”赫夫曼树“之前,几个必须要知道的专业名词可要熟练记住啊。

 

    1: 结点的权

            “权”就相当于“重要度”,我们形象的用一个具体的数字来表示,然后通过数字的大小来决定谁重要,谁不重要。

    2: 路径

             树中从“一个结点"到“另一个结点“之间的分支。

    3: 路径长度

             一个路径上的分支数量。

    4: 树的路径长度

             从树的根节点到每个节点的路径长度之和。

    5: 节点的带权路径路劲长度

             其实也就是该节点到根结点的路径长度*该节点的权。

    6:   树的带权路径长度

             树中各个叶节点的路径长度*该叶节点的权的和,常用WPL(Weight Path Length)表示。

 

二: 构建赫夫曼树

        上面说了那么多,肯定是为下面做铺垫,这里说赫夫曼树,肯定是要说赫夫曼树咋好咋好,赫夫曼树是一种最优二叉树,

         因为他的WPL是最短的,何以见得?我们可以上图说话。

   

\

现在我们做一个WPL的对比:

图A: WPL= 5*2 + 7*2 +2*2+13*2=54

图B:WPL=5*3+2*3+7*2+13*1=48

 

我们对比一下,图B的WPL最短的,地球人已不能阻止WPL还能比“图B”的小,所以,“图B"就是一颗赫夫曼树,那么大家肯定

要问,如何构建一颗赫夫曼树,还是上图说话。

\

 

第一步: 我们将所有的节点都作为独根结点。

第二步:   我们将最小的C和A组建为一个新的二叉树,权值为左右结点之和。

第三步: 将上一步组建的新节点加入到剩下的节点中,排除上一步组建过的左右子树,我们选中B组建新的二叉树,然后取权值。

第四步: 同上。

 

三: 赫夫曼编码

      大家都知道,字符,汉字,数字在计算机中都是以0,1来表示的,相应的存储都是有一套编码方案来支撑的,比如ASC码。

 这样才能在"编码“和”解码“的过程中不会成为乱码,但是ASC码不理想的地方就是等长的,其实我们都想用较少的空间来存储

更多的东西,那么我们就要采用”不等长”的编码方案来存储,那么“何为不等长呢“?其实也就是出现次数比较多的字符我们采用短编码,

出现次数较少的字符我们采用长编码,恰好,“赫夫曼编码“就是不等长的编码。

    这里大家只要掌握赫夫曼树的编码规则:左子树为0,右子树为1,对应的编码后的规则是:从根节点到子节点

A: 111

B: 10

C: 110

D: 0

\

 

四: 实现

      不知道大家懂了没有,不懂的话多看几篇,下面说下赫夫曼的具体实现。

         第一步:构建赫夫曼树。

         第二步:对赫夫曼树进行编码。

         第三步:压缩操作。

         第四步:解压操作。

 

 

1:首先看下赫夫曼树的结构,这里字段的含义就不解释了。

 

 1 #region 赫夫曼树结构

 2     /// <summary>

 3 /// 赫夫曼树结构

 4 /// </summary>

 5     public class HuffmanTree

 6     {

 7         public int weight { get; set; }

 8

 9         public int parent { get; set; }

10

11         public int left { get; set; }

12

13         public int right { get; set; }

14     }

15     #endregion

www.zzzyk.com

 

 

2: 创建赫夫曼树,原理在上面已经解释过了,就是一步一步的向上搭建,这里要注意的二个性质定理:

 

         当叶子节点为N个,则需要N-1步就能搭建赫夫曼树。

 

         当叶子节点为N个,则赫夫曼树的节点总数为:(2*N)-1个。

 

  1 #region 赫夫曼树的创建

  2         /// <summary>

  3 /// 赫夫曼树的创建

  4 /// </summary>

  5 /// <param name="huffman">赫夫曼树</param>

  6 /// <param name="leafNum">叶子节点</param>

  7 /// <param name="weight">节点权重</param>

  8         public HuffmanTree[] CreateTree(HuffmanTree[] huffman, int leafNum, int[] weight)

  9         {

 10             //赫夫曼树的节点总数

 11             int huffmanNode = 2 * leafNum - 1;

 12

 13             //初始化节点,赋予叶子节点值

 14             for (int i = 0; i < huffmanNode; i++)

 15             {

 16                 if (i < leafNum)

 17                 {

 18                     huffman[i].weight = weight[i];

 19                 }

 20             }

 21

 22             //这里面也要注意,4个节点,其实只要3步就可以构造赫夫曼树

 23             for (int i = leafNum; i < huffmanNode; i++)

 24             {

 25                 int minIndex1;

 26                 int minIndex2;

 27                 SelectNode(huffman, i, out minIndex1, out minIndex2);

 28

 29   

补充:软件开发 , 其他 ,
CopyRight © 2012 站长网 编程知识问答 www.zzzyk.com All Rights Reserved
部份技术文章来自网络,