ITU-T的G.7xx系列建議包括語音(窄帶,300~3400Hz)編碼技術(shù)和音頻(寬帶,50Hz~7kHz)編碼技術(shù)。這里重點(diǎn)介紹PSTN電話通信中的語音編碼的ITU-T標(biāo)準(zhǔn)。對(duì)于語音編碼技術(shù),ITU-T分別研制采用了如下不同的編碼技術(shù)。關(guān)于下述ITU-T的窄帶語音編碼技術(shù)的一些技術(shù)性能比較被列于下表0中。
表0:ITU-T所研制使用的窄帶語音技術(shù)的性能簡(jiǎn)單比較
一、PCM語音編碼技術(shù)
脈沖編碼調(diào)制(PCM,Pulse Code Modulation)語音編碼技術(shù)是ITU-T研究制定的 PSTN電話通信最高通信質(zhì)量的標(biāo)準(zhǔn),它就是ITU-T G.711建議。ITU-T在1972年12月發(fā)布了G.711的第1個(gè)版本,已經(jīng)過了1976、1980、1984、1988年修訂的第5個(gè)版本,即ITU-T G.711(11/1988)《語音頻率的脈沖編碼調(diào)制(PCM)》。
欲詳細(xì)了解ITU-T G.711建議的高質(zhì)量64 kb/s的PCM編碼技術(shù)的請(qǐng)進(jìn)入。
二、ADPCM語音編碼技術(shù)
ITU-T研究制定的自適應(yīng)差分脈沖編碼調(diào)制(ADPCM,Adaptive Differential Pulse Code Modulation)語音編碼標(biāo)準(zhǔn)有以下幾個(gè):
欲進(jìn)一步了解ADPCM編碼技術(shù)概念的請(qǐng)進(jìn)入。
1、ITU-T G.721建議的高音質(zhì)32 kb/s的ADPCM編碼技術(shù)
1984年ITU-T公布了G.721建議,這一建議規(guī)定了關(guān)于高音質(zhì)32 kb/s ADPCM語音編碼的國際標(biāo)準(zhǔn),該建議于1986年做了進(jìn)一步的修改。這種算法的話音質(zhì)量十分接近G.711 A律或μ律64 kb/s PCM的話音質(zhì)量,MOS分為4.1,達(dá)到了網(wǎng)絡(luò)質(zhì)量等級(jí)。經(jīng)過4次非同步轉(zhuǎn)接后MOS分仍在3.5分以上。其抗誤碼性能優(yōu)于PCM,帶內(nèi)數(shù)據(jù)傳輸率能達(dá)4800 b/s,其音頻帶寬為200~3400 Hz,采樣頻率為8 kHz,每一樣點(diǎn)用4 bit編碼。由于G.721建議的高音質(zhì)32 kb/s ADPCM主要用來對(duì)現(xiàn)有PCM信道擴(kuò)容,即把2個(gè)2048 kb/s 30路PCM基群信號(hào)轉(zhuǎn)換成一個(gè)2048 kb/s 60路ADPCM信號(hào),因此ADPCM編碼輸入與譯碼器輸出都采用標(biāo)準(zhǔn)A律或μ律PCM信碼。該建議被后來的G.726所代替。
欲更多了解MOS音質(zhì)評(píng)價(jià)法的請(qǐng)進(jìn)入。
2、ITU-T G.726建議的高音質(zhì)多速率的ADPCM編碼技術(shù)
ITU-T在1984年10月發(fā)布了G.726的第1個(gè)版本,已經(jīng)過了1987、1988、1990年修訂的第4個(gè)版本,即ITU-T G.726(12/1990)《40、32、24、16kbit/s自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)》。
G.726建議將64kbit/的A律μ律脈碼調(diào)制(PCM)通道轉(zhuǎn)換為40、32、24或16 kbit / s通道。使用ADPCM代碼轉(zhuǎn)換技術(shù)將轉(zhuǎn)換應(yīng)用于PCM位流。24和16 kbit/s通道的主要應(yīng)用是在數(shù)字電路倍增設(shè)備(DCME)中傳輸聲音的重載通道,40kbit/s通道的主要應(yīng)用是在DCME中傳輸數(shù)據(jù)調(diào)制解調(diào)器信號(hào),特別是對(duì)大于4800kbit/s的調(diào)制解調(diào)器。
3、ITU-T G. 727建議的鑲嵌式ADPCM
本建議書包含每個(gè)樣本具有5-,4-,3-和2-位的嵌入式自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)算法的規(guī)范(即,以40、32、24和16kbit/s的速率)。描述的特性推薦用于64 kbit/s的轉(zhuǎn)換,即A律或μ律PCM通道到/從可變速率嵌入式ADPCM通道的轉(zhuǎn)換。
ITU-T公布了G.721建議的高質(zhì)量32 kb/s ADPCM之后,在G.723建議中將編碼的速率擴(kuò)充到40 kb/s和24 kb/s,又在G.726建議中將編碼速率擴(kuò)充為16 ~40 kb/s的一套完整速率的ADPCM算法。同語音插空技術(shù)相結(jié)合,采用變速率ADPCM可以使原有PCM信道擴(kuò)容到8~10倍,這稱為數(shù)字話路倍增設(shè)備(DCME)。這種設(shè)備適用于點(diǎn)到點(diǎn)之間的固定線路擴(kuò)容,例如衛(wèi)星或海纜的DCME系統(tǒng)。但隨著社會(huì)對(duì)通信需求量的不斷提高,僅兩點(diǎn)之間通信效率提高還不夠,需要整個(gè)網(wǎng)的通信效率都能提高,辦法之一是采用語音裝包傳輸系統(tǒng),它不僅具有DCME系統(tǒng)的擴(kuò)容能力,并且適合交換,便于成網(wǎng)。
語音包交換關(guān)鍵問題之一是線路擁塞及對(duì)擁塞的處理。在一段短時(shí)間內(nèi)到達(dá)包交換機(jī)的語音包數(shù)量太多,包交換機(jī)來不及處理產(chǎn)生擁塞,一般有兩種解決辦法。一種解決辦法是丟棄一些過量的語音包,當(dāng)丟包量比較大時(shí),語聲質(zhì)量受到嚴(yán)重的損害。另一種辦法是不丟棄整個(gè)語音包,而只丟棄包中不重要的比特,仍將重要比特或稱核心比特傳送到譯碼器,以此緩解擁塞問題。當(dāng)然,這也會(huì)使語音質(zhì)量下降,但比起整段語音被丟棄總要好。采用這種方法時(shí)要求語音編譯碼算法具有如下的特性:它可以允許傳輸網(wǎng)絡(luò)自主地丟棄一些比特,而譯碼器仍能根據(jù)剩下的比特恢復(fù)語音信號(hào)。鑲嵌式語音編碼就具有這種特性。AT&T以及NTT等公司分別研究了包交換用鑲嵌式語音編碼,都主張采用鑲嵌式ADPCM。在經(jīng)過細(xì)致的研究工作之后,ITU-T于1990年12月通過了40~16kb/s鑲嵌式ADPCM標(biāo)準(zhǔn)G.727。
G.727鑲嵌式ADPCM編碼器與G.721的編碼器基本相同,只是在反饋支路上,逆量化器比之前多了一個(gè)反饋比特屏蔽單元。G. 727譯碼器同G. 721譯碼器差別稍大一些。除了上面提到的反饋比特屏蔽單元之外,還多了一條前饋支路,用來產(chǎn)生實(shí)際輸出的重建語音信號(hào)。G.727建議也包括40、32、24、16 kb/s四個(gè)速率,其采樣頻率為8kHz。對(duì)于32 kb/s和24kb/s,G.727 ADPCM比G.726 ADPCM的MOS分僅下降0.03分。
三、LD-CELP語音編碼技術(shù)
1992年9月ITU-T G.728建議規(guī)定采用低延時(shí)碼激勵(lì)線性預(yù)測(cè)(LD-CELP,low-delay code excited linear prediction)編碼作為16 kb/s語音編碼標(biāo)準(zhǔn)化方案,2012年6月又對(duì)其進(jìn)行了修訂,即ITU-T G.728(06/2012)《使用低延遲碼激勵(lì)線性預(yù)測(cè)16 kbit/s語音編碼》。
16 kb/s低延時(shí)線性預(yù)測(cè)編碼(LD-CELP)之前的各種線性預(yù)測(cè)編碼方案,都是利用前向自適應(yīng)預(yù)測(cè)器去除語音信號(hào)的冗余度,需要有足夠的編碼延時(shí)和存儲(chǔ)空間,典型的編碼延時(shí)為40~60 ms之間。LD-CELP聲碼器使用后向自適應(yīng)預(yù)測(cè)器對(duì)短時(shí)譜包絡(luò)和增益進(jìn)行預(yù)測(cè),其算法延時(shí)為0.625ms,一路編碼延時(shí)小于 2 ms。合成語音質(zhì)量良好,MOS分可達(dá)4.17分。
四、CS-ACELP語音編碼技術(shù)
1996年3月ITU-T G. 729建議規(guī)定8 kb/s共扼結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)(CS-ACELP,conjugate-structure algebraic-code-excited linear prediction)。CS-ACELP編碼作為8 kb/s語音編碼標(biāo)準(zhǔn)化方案,2007年和2012年又經(jīng)過了兩次修訂,即ITU-T G. 729(06/2012)《使用共軛結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)(CS-ACELP)在8 kbit / s的語音編碼》。
CS-ACELP編碼其合成語音質(zhì)量較好,其編碼時(shí)延為25 ms,復(fù)雜度較低,可在現(xiàn)有DSP上實(shí)現(xiàn)。共扼結(jié)構(gòu)代數(shù)碼激勵(lì)線性預(yù)測(cè)(CS-ACELP)的編碼方案是由共扼結(jié)構(gòu)碼激勵(lì)線性預(yù)測(cè)(CS-CELP)和代數(shù)碼激勵(lì)線性預(yù)測(cè)(ACELP)的思想整合而來的?!肮捕蟆保?span>conjugate structure,CS)的含義是指編碼器對(duì)增益的矢量量化過程中采用了共扼結(jié)構(gòu);而所謂“代數(shù)”(algelraic,A)碼書是指其固定碼書采用了代數(shù)結(jié)構(gòu),它的特點(diǎn)是碼書矢量為40維,其中只有4個(gè)非零脈沖,其幅度為+1或-1,位置在限定的范圍內(nèi)。這種碼書的優(yōu)點(diǎn)是無需任何存儲(chǔ)空間,只要譯碼端獲得非零脈沖的幅度和位置信息,即可得到響應(yīng)的輸出矢量。
欲更多了解激勵(lì)線性預(yù)測(cè)編碼概念的請(qǐng)進(jìn)入。
欲更多了解語音編碼知識(shí)的請(qǐng)進(jìn)入。:關(guān)于國際上窄帶語音編碼的標(biāo)準(zhǔn);關(guān)于常用語音編碼及特性;關(guān)于音頻信號(hào)的特性