在現今的電子信息技術領域,正發生著一場有長遠影響的數字化革命。由于數字化的多媒體信息尤其是數字視頻、音頻信號的數據量特別龐大,如果不對其進行有效的壓縮就難以得到實際的應用。因此,數據壓縮技術已成為當今數字通信、廣播、存儲和多媒體娛樂中的一項關鍵的共性技術。
1、數據為何要壓縮
數據壓縮,通俗地說,就是用最少的數碼來表示信號。其作用在于:一是能較快地傳輸各種信號,如傳真、Modem通信等;二是在現有的通信干線并行開通更多的多媒體業務,如各種增值業務;三是緊縮數據存儲容量,如CD-ROM、VCD和DVD等;四是降低發信機功率,這對于多媒體移動通信系統尤為重要。由此看來,通信時間、傳輸帶寬、存儲空間甚至發射能量,都可能成為數據壓縮的對象。
2、數據為何能被壓縮
首先,數據中間常存在一些多余成分,既冗余度。如在一份計算機文件中,某些符號會重復出現、某些符號比其他符號出現得更頻繁、某些字符總是在各數據塊中可預見的位置上出現等,這些冗余部分便可在數據編碼中除去或減少。冗余度壓縮是一個可逆過程,因此叫做無失真壓縮,或稱保持型編碼。其次,數據中間尤其是相鄰的數據之間,常存在著相關性。如圖片中常常有色彩均勻的背影,電視信號的相鄰兩幀之間可能只有少量的變化影物是不同的,聲音信號有時具有一定的規律性和周期性等等。因此,有可能利用某些變換來盡可能地去掉這些相關性。但這種變換有時會帶來不可恢復的損失和誤差,因此叫做不可逆壓縮,或稱有失真編碼、嫡壓縮等。此外,人們在欣賞音像節目時,由于耳、目對信號的時間變化和幅度變化的感受能力都有一定的極限,如人眼對影視節目有視覺暫留效應,人眼或人耳對低于某一極限的幅度變化已無法感知等,故可將信號中這部分感覺不出的分量壓縮掉或“掩蔽掉”。這種壓縮方法同樣是一種不可逆壓縮。
對于數據壓縮技術而言,最基本的要求就是要盡量降低數字化的在碼事,同時仍保持一定的信號質量。不難想象,數據壓縮的方法應該是很多的,但本質上不外乎上述完全可逆的冗余度壓縮和實際上不可逆的嫡壓縮兩類。冗余度壓縮常用于磁盤文件、數據通信和氣象衛星云圖等不允許在壓縮過程中有絲毫損失的場合中,但它的壓縮比通常只有幾倍,遠遠不能滿足數字視聽應用的要求。在實際的數字視聽設備中,差不多都采用壓縮比更高但實際有損的嫡壓縮技術。
只要作為最終用戶的人覺察不出或能夠容忍這些失真,就允許對數字音像信號進一步壓縮以換取更高的編碼效率。嫡壓縮主要有特征抽取和量化兩種方法,指紋的模式識別是前者的典型例子,后者則是一種更通用的嫡壓縮技術。
3、數字音、視頻的壓縮標準
1)數字音頻壓縮技術標準分為電話語音壓縮、調幅廣播語音壓縮和調頻廣播及CD音質的寬帶音頻壓縮3種。
(1)電話(200Hz~3.4kHz)語音壓縮,主要有國際電信聯盟(ITU)的G.711(64kbit/s、G.721(32kbit/s)、G.728(16kbit/s)和G.729(8kbit/s)的建議等,用于數字電話通信。
(2)調幅廣播(50Hz~7kHz)語音壓縮,采用ITU的G.722(64kbit/s)建議,用于優質語音、音樂、音頻會議和視頻會議等。
(3)調頻廣播(20Hz~15kHz)及CD音質(20Hz~20KHz)的寬帶音頻壓縮,主要采用MPEG-1或2、雙杜比AC-3等建議,用于CD、MD、MPC、VCD、DVD、HDTV電影配音等。
2)視頻壓縮技術標準主要有:
(1)ITU H.261建議,用于ISDN信道的PC電視電話、桌面視頻會議和音像郵件等通信終端。
(2)MPEG-1視頻壓縮標準,用于 VCD、MPC、PC/TV一體機、交互電視IPTV和視頻點播VOD。
(3)MPEG-2/ITU H.262視頻標準,主要用于數字存儲。視頻廣播和通信,如HDTV、CATV、DVD、VOD和電影點播MOD等。
(4)ITU H.263建議,用于網上的可視電話、移動多媒體終端、多媒體可視圖文、遙感、電子郵件、電子報紙和交互式計算機成像等。
(5)MPEG-4和 ITU H.264低碼率多媒體通信標準。
4、數據壓縮的實現
在各種數據類型中,最難實現的是數字視頻的實時壓縮,因為視頻信號尤其是HDTV信號所占據的帶寬甚寬,實時壓縮需要很高的處理速度?,F在,視頻解碼以及音頻的編碼、解碼多依賴于專用芯片或數字信號處理器(DSP)來完成,并已有許多廠商推出了音視合一的單片MPEG-1、MPEG-2解碼器。我國在發展數據壓縮技術過程中,則充分利用了軟件人才優勢。在軟件實現方面,由于PC主機的處理能力正在飛速提高,直接利用主CPU編程實現各種視聽壓縮和解碼算法對于桌面系統及家用多媒體將越來越有吸引力。1996年上半年,Intel向全球軟件界發布了它的微處理器媒體擴展(MMX)技術。這種技術主要是在Pentium或Pentium Pro芯片中增加了8個64位寄存器和57條功能強大的新指令,以提高多媒體和通信應用程序中某些計算密集的循環速度。MMX采用單指令多數據(SIMD)技術并行處理多個信號采樣值,可使不同的應用程序性能成倍提高。如:視頻壓縮可提高1.5倍,圖像處理可提高40倍,音頻處理可提高3.7倍,語音識別可提高1.7倍,三維動畫可提高20倍。