在圖文傳真機(jī)中,圖文數(shù)據(jù)用二進(jìn)制數(shù)表示,每位二進(jìn)制數(shù)據(jù)代表1bit,對應(yīng)原始圖文一個(gè)像素。因此,每幅圖文的像素總數(shù)等于圖文數(shù)據(jù)的比特總數(shù)。這樣,圖文數(shù)據(jù)的信息量是相當(dāng)大的,要提高傳真機(jī)的傳輸速率,必須對圖文數(shù)據(jù)的傳息量進(jìn)行壓縮。傳真通信是一種靜止圖文的傳送,在這個(gè)過程中,整幅圖文經(jīng)歷了一個(gè)分解與合成的過程。因此,無論原稿有多么復(fù)雜,經(jīng)過分解(掃描)之后,它都是一連串黑白點(diǎn)的集合,在經(jīng)過光電變換后的掃描器輸出中,它都是一連串在時(shí)間上不連續(xù)的脈沖電信號。這些輸出的脈沖電信號,便是傳真的信號源,我們稱之為信源。
從數(shù)學(xué)的觀點(diǎn)來看,信源是一個(gè)概率空間,它的作用是按樣本空間的概率分布一個(gè)接一個(gè)地把樣本發(fā)出去。這一序列樣本,便叫做消息,消息中的不肯定成分,才是我們通常所說的信息。一般來說,消息中含有信息,但消息不一定完全是信息。信源發(fā)出的消息中不肯定程度越大,夾帶的信息就越多,反之就越少。在這里,不肯定程度是信源各消息(或符號)的函數(shù)。信息的多少(信息量)最終決定于信源內(nèi)各消息的概率分布。
任何種類的通信都是以傳遞信息為目的。為了提高通信系統(tǒng)的有效性和利用率,人們采取了各種各樣的手段,其中最重要的便是對消息進(jìn)行預(yù)加工,去掉那些可以肯定的成分(稱為剩余度或冗余度),只傳遞那些一定要傳送的東西,以此來提高信息的含量。這里有兩個(gè)關(guān)鍵問題要解決:一是信源中有沒有冗余度?二是如何去掉它們?三類傳真機(jī)正是從對傳真信號的統(tǒng)計(jì)分析著手,有效地解決了這兩個(gè)間題,才獲得了文件高速傳遞的效果。
數(shù)字化編碼壓縮基于傳真信號的統(tǒng)計(jì)性質(zhì)。數(shù)字傳真機(jī)利用傳真稿件的統(tǒng)計(jì)特性來削減多余度,從實(shí)用的觀點(diǎn)出發(fā),實(shí)際利用的統(tǒng)計(jì)特性主要有:白像素和黑像素發(fā)生概率的差異;相鄰像素之間的相關(guān)性以及統(tǒng)計(jì)量因圖文不同而存在的差異等。表1列出7種中文鉛印文件的統(tǒng)計(jì)情況。由表1可以看出:
表1:7種中文鉛印文件的各種概率
1)白像素出現(xiàn)的概率大于90%;
2)黑像素出現(xiàn)的概率小于10%,甚至不到5%;
3)由白像素變?yōu)楹谙袼爻霈F(xiàn)的概率比白像素單獨(dú)出現(xiàn)的概率小得多,也比黑像素單獨(dú)出現(xiàn)概率小;
4)由黑像素變?yōu)榘紫袼爻霈F(xiàn)的概率比白像素單獨(dú)出現(xiàn)的概率小得多,但也比黑像素單獨(dú)出現(xiàn)的概率大。
這說明相鄰像素之間存在著很強(qiáng)的相關(guān)性,在主、副掃描方向也都存在這種相關(guān)性。結(jié)合某一具體的像素來說,只要知道它上下前后像素的黑白情況,就可大致判定它是黑還是白。傳真信號在實(shí)現(xiàn)編碼壓縮時(shí)正是利用這種統(tǒng)計(jì)特性理論為基礎(chǔ)的。通過上面的討論還得知如下表2的相關(guān)結(jié)論。
表2:像素的概率與相關(guān)性
利用上述的統(tǒng)計(jì)特性對黑白像素持續(xù)長度編碼,可使數(shù)據(jù)量得到壓縮。如對出現(xiàn)概率最大的持續(xù)長度用最短的碼字表示,而對出現(xiàn)概率最小的持續(xù)長度用最長的碼字表示。也就是根據(jù)持續(xù)長度出現(xiàn)的不同概率,分配不同長度的碼字,碼的長度與概率分布相匹配,這種編碼方法,稱為統(tǒng)計(jì)匹配方法。由于它用最低限度的數(shù)據(jù)量傳遞持續(xù)長度所包含的信息,數(shù)據(jù)的壓縮率就會很高,所以又稱為最佳編碼。
編碼,就是賦予每個(gè)數(shù)據(jù)一個(gè)對應(yīng)的代碼,把一個(gè)數(shù)據(jù)序列變換成另一個(gè)數(shù)據(jù)序列。如果編碼后的數(shù)據(jù)序列短于編碼前的數(shù)據(jù)序列,說明數(shù)據(jù)被壓縮了。同樣,也縮短了傳輸時(shí)間或節(jié)省了傳輸頻帶。由于這種編碼減少了信源的冗余度,因此也叫做信源編碼。
傳真信號轉(zhuǎn)變?yōu)閿?shù)字信號后,白像素用“0”表示,黑像素用“1”表示,則每一個(gè)二進(jìn)制碼“0”或“1”都表示一位圖像信號。這樣一行標(biāo)準(zhǔn)的A4幅面的圖像信號經(jīng)過光電變換分解成1728個(gè)圖像信號,也就需要1 728bit表示,并要傳輸這1 728bit的信息量,如果采用不同的掃描線密度和常用幾種白紙時(shí),我們就可以算它們能有多少行了。
例如:一張A4文件的數(shù)據(jù)總量為
(210mm×8點(diǎn))×(297mm×3.85線/mm)=1 920 996bit。
以9 600bit/s的速率傳送這些數(shù)據(jù)所需要的時(shí)間為
1 920 996÷9600=207s(約3min)。
如通過編碼壓縮,可壓縮1/20之多,這樣傳輸時(shí)間可減為207÷20=10s左右了。由此可見,在傳真信號中存在著很大的多余度,如何去掉這些多余度,就是編碼壓縮的目的。
例如:一條長216mm全白掃描線的白像素為1 728個(gè),其信息量為1 728bit,通過編碼將其轉(zhuǎn)化為010011011的碼字,信息量變成了9bit,從而壓縮了大量的信息多余度。因此,從總體上說來,編碼后的碼序列平均持續(xù)長度,還是遠(yuǎn)遠(yuǎn)短于編碼前的碼序列平均持續(xù)長度。一般壓縮比為3~20倍,平均壓縮比為5~6倍。
在三類機(jī)中,除了經(jīng)過對信號游程進(jìn)行編碼,充分利用信號水平方向和垂直方向的相關(guān)徑,去除信息中的冗余度,以實(shí)現(xiàn)頻帶壓縮外,還采用了可以自動選擇通信速率,并具有自動均衡性能的調(diào)制解調(diào)器,使傳真通信能在最佳狀態(tài)下進(jìn)行。因此,在同樣的線路上,三類機(jī)往往能夠得到比一二類機(jī)更快更好的通信效果。
ITU為G3機(jī)規(guī)定了必備的兩種編碼方式:一維編碼,即霍夫曼編碼MH碼;二維編碼,即霍夫曼編碼MR碼。
欲詳細(xì)了解G3傳真機(jī)編碼方式的請進(jìn)入。
欲進(jìn)一步了解G3傳真機(jī)基本參數(shù)要求的請進(jìn)入。