CSDN首页 空间 新闻 论坛 Blog 下载 读书 网摘 搜索 .NET Java 视频 接项目 求职 在线学习 买书 程序员 通知
可用分押宝游戏火热进行中... 专题改版:Java Web 专题
CSDN社区
搜索 收藏 打印 关闭
CSDN社区 >  专题开发/技术/项目 >  数据结构与算法

请问一下 LZW LZ77 LZ78有没有超过信息熵?RAR最好选项格式呢?

楼主balzac911(balzac911)2005-08-01 16:37:37 在 专题开发/技术/项目 / 数据结构与算法 提问

请问一下   LZW   LZ77   LZ78有没有超过信息熵?RAR最好选项格式呢?    
  如果有一个算法,256个不同的字符,熵要8个位256字符  
  而此算法仅平均7位,比熵少用31字符!  
  如果是  
  cabcedeacacdeddaaabaababaaabbacdebaceada  
  101   0   100   101   111   110   111   0   101   0   101   ......  
  码长共   88   位。这比使用   Shannon-Fano   编码要更短一点。  
   
  让我们回顾一下熵的知识,使用我们在第二章学到的计算方法,上面的例子中,每个字符的熵为:  
   
  Ea   =   -   log2(16   /   40)   =   1.322  
  Eb   =   -   log2(   7   /   40)   =   2.515  
  Ec   =   -   log2(   6   /   40)   =   2.737  
  Ed   =   -   log2(   6   /   40)   =   2.737  
  Ee   =   -   log2(   5   /   40)   =   3.000  
  信息的熵为:  
   
  E   =   Ea   *   16   +   Eb   *   7   +   Ec   *   6   +   Ed   *   6   +   Ee   *   5   =   86.601  
  也就是说,表示该条信息最少需要   86.601   位。我们看到,Shannon-Fano   编码和   Huffman   编码都已经比较接近该信息的熵值了。同时,我们也看出,无论是   Shannon-Fano   还是   Huffman,都只能用近似的整数位来表示单个符号,而不是理想的小数位。我们可以将它们做一个对比:  
   
        符号             理想位数           S-F   编码         Huffman   编码    
                            (   熵   )               需要位数         需要位数  
    ----------------------------------------------------  
          a                   1.322                   2                       1  
          b                   2.515                   2                       3  
          c                   2.737                   2                       3  
          d                   2.737                   3                       3  
          e                   3.000                   3                       3  
    ----------------------------------------------------  
      总   计             86。601                 91                     88  
   
  而新的算法码长只要85个位,  
  所以想问一下如果和RAR比,哪个更厉害? 问题点数:10、回复次数:0Top

相关问题

  • DCOM网络选项?
  • dropdownlist选项问题?
  • 选项卡的问题
  • Tabstripe选项卡的问题
  • 100:“时间下拉选项”
  • 可停靠选项卡?
  • SET选项设置问题
  • 关于project 选项设置
  • 讨厌的1234567选项!
  • javascript动态的选项.

关键词

  • 编码
  • 字符
  • 位数
  • 信息
  • lz
  • fano
  • rar
  • shannon
  • huffman
  • log2

得分解答快速导航

  • 帖主:balzac911

相关链接

  • CSDN Blog
  • 技术文档
  • 代码下载
  • 第二书店
  • 读书频道

广告也精彩

反馈

请通过下述方式给我们反馈
反馈
提问
网站简介|广告服务|VIP资费标准|银行汇款帐号|网站地图|帮助|联系方式|诚聘英才|English|问题报告
世纪乐知(北京)网络技术有限公司 版权所有, 京 ICP 证 020026 号
北京创新乐知广告有限公司 提供技术支持
Copyright © 2000-2007, CSDN.NET, All Rights Reserved
GongshangLogo