谈谈数据压缩技术(胡启明)
在现今的电子信息技术领域,正发生着一场有长远影响的数字化革命。由于数字
化的多媒体信息尤其是数字视频、音频信号的数据量特别庞大,如果不对其进行有效
的压缩就难以得到实际的应用。因此,数据压缩技术已成为当今数字通信、广播、存
储和多媒体娱乐中的一项关键的共性技术。
1.什么是数据压缩
数据压缩,通俗地说,就是用最少的数码来表示信号。其作用是:能较快地传输
各种信号,如传真、Modem通信等;在现有的通信干线并行开通更多的多媒体业务,
如各种增值业务;紧缩数据存储容量,如 CD-ROM、VCD和DVD等;降低发信机功率,
这对于多媒体移动通信系统尤为重要。由此看来,通信时间、传输带宽、存储空间甚
至发射能量,都可能成为数据压缩的对象。
2.数据为何能被压缩
首先,数据中间常存在一些多余成分,既冗余度。如在一份计算机文件中,某些
符号会重复出现、某些符号比其他符号出现得更频繁、某些字符总是在各数据块中可
预见的位置上出现等,这些冗余部分便可在数据编码中除去或减少。冗余度压缩是一
个可逆过程,因此叫做无失真压缩,或称保持型编码。
其次,数据中间尤其是相邻的数据之间,常存在着相关性。如图片中常常有色彩
均匀的背影,电视信号的相邻两帧之间可能只有少量的变化影物是不同的,声音信号
有时具有一定的规律性和周期性等等。因此,有可能利用某些变换来尽可能地去掉这
些相关性。但这种变换有时会带来不可恢复的损失和误差,因此叫做不可逆压缩,或
称有失真编码、摘压缩等。
此外,人们在欣赏音像节目时,由于耳、目对信号的时间变化和幅度变化的感受
能力都有一定的极限,如人眼对影视节目有视觉暂留效应,人眼或人耳对低于某一极
限的幅度变化已无法感知等,故可将信号中这部分感觉不出的分量压缩掉或“掩蔽掉”。
这种压缩方法同样是一种不可逆压缩。
对于数据压缩技术而言,最基本的要求就是要尽量降低数字化的在码事,同时仍
保持一定的信号质量。不难想象,数据压缩的方法应该是很多的,但本质上不外乎上
述完全可逆的冗余度压缩和实际上不可逆的嫡压缩两类。冗余度压缩常用于磁盘文件、
数据通信和气象卫星云图等不允许在压缩过程中有丝毫损失的场合中,但它的压缩比
通常只有几倍,远远不能满足数字视听应用的要求。
在实际的数字视听设备中,差不多都采用压缩比更高但实际有损的媳压缩技术。
只要作为最终用户的人觉察不出或能够容忍这些失真,就允许对数字音像信号进一步
压缩以换取更高的编码效率。摘压缩主要有特征抽取和量化两种方法,指纹的模式识
别是前者的典型例子,后者则是一种更通用的摘压缩技术。
3数字音、视频的压缩标准
数字音频压缩技术标准分为电话语音压缩、调幅广播语音压缩和调频广播及CD音
质的宽带有频压缩3种。
(1)电话(200HZ-3.4kHZ)语音压缩,主要有国际电信联盟(ITU)的G.711(6
4kbit/s、G.721(32kbit/s)、G.728(16kbit/s)和G.729(8kbit/的建议等,
用于数字电话通信。
(2)调幅广播(50HZ-7kHZ)语音压缩,采用ITU的G.722(64kbit/s)建议,用
于优质语音、音乐、音频会议和视频会议等。
(3)调频广播(20HZ-15kHZ)及CD音质(20HZ-20kH)的宽带音频压缩,主要
采用MPEG-1或2双杜比AC-3等建议,用于CD、MD、MPC、VCD、DVD、HDTV和电影配音
等。
视频压缩技术标准主要有:
①ITU H.261建议,用于ISDN信道的PC电视电话、桌面视频会议和音像邮件等通
信终端。
②MPEG-1视频压缩标准,用于 VCD、MPC、PC/TV一体机、交互电视ITV和电视
点播VOD。
③MPEG-2/ITU H.262视频标准,主要用于数字存储。视频广播和通信,如HDTV、
CATV、DVD、VOD和电影点播MOD等。
④ITU H.263建议,用于网上的可视电话、移动多媒体终端、多媒体可视图文、
遥感、电子邮件、电子报纸和交互式计算机成像等。
⑤MPEG-4和 ITU H.VLC/L低码率多媒体通信标准仍在发展之中。
4.数据压缩的实现
在各种数据类型中,最难实现的是数字机频的实时压缩,因为视频信号尤其是HD
TV信号所占据的带宽甚宽,实时压缩需要很高的处理速度。现在,视频解码以及音频
的编码、解码多依赖于专用芯片或数字信号处理器(DSP)未完成,并已有许多厂商
推出了音视合一的单片MPEG-1、MPEG-2解码器。
我国在发展数据压缩技术过程中,则充分利用了软件人才优势。在软件实现方面,
由于PC主机的处理能力正在飞速提高,直接利用主CPU编程实现各种视听压缩和解码
算法对于桌面系统及家用多媒体将越来越有吸引力。1996年上半年,Intel向全球软
件界发布了它的微处理器媒体扩展(MMX)技术。这种技术主要是在Pentium或Pentiu
m Pro芯片中增加了8个64位寄存器和57条功能强大的新指令,以提高多媒体和通信应
用程序中某些计算密集的循环速度。MMX采用单指令多数据(SIMD)技术并行处理多
个信号采样值,可使不同的应用程序性能成倍提高。如:视频压缩可提高1.5倍,图
像处理可提高40倍,音频处理可提高3.7偌,语音识别可提高1.7倍,三维动画可提高
20倍。
与Pentium完全兼容的P55C芯片是1998年3月正式推出的。以后推出的Pentium、
Pentium pro或P7等CPU,均将支持MMX指令。
在数据压缩的硬件实现方面,根本的出路是要有自己的音像压缩芯片(特别是解
压芯片),不管是专用集成电路(ASIC)实现,还是借助于通用DSP来编程。而这一
类芯片,目前还只是“雾里看花”。不过我们相信,在不久的将来,这些也会成为现
实。