成语大全网 - 汉语词典 - 什么叫文本压缩,他的定义是什么?

什么叫文本压缩,他的定义是什么?

文本压缩(text compression) 是数据压缩(data compression) 的一个分支, 属于无损压缩(lossless compression) 。它的目标是通过对数据施加某种操作或变换使之长度变短的同时, 还必须保证原始数据能够从压缩产生的压缩码中得以精确的还原。主要的文本压缩编码有:Huffman 编码,算术编码,游程编码,LZ 编码,LZW编码等。

算法分类

文本压缩算法可以划分为统计方法和词典编码方法。

统计方法当以Huffman 编码( Huffman coding) 和算术编码(arithmetic coding) 为代表。这种方法需要统计信源符号的概率分布情况, 并根据统计结果产生压缩码。统计可以一次性完成(如静态Huffman 编码) , 也可以边编码边统计(如动态Huffman 编码) 。

更多的自己看网站吧