窄帶語(yǔ)音編碼主要是指電話通信中的語(yǔ)音編碼,所謂窄帶即是指300~3400Hz頻帶。從事語(yǔ)音編碼標(biāo)準(zhǔn)制定的國(guó)際組織主要有:國(guó)際電信聯(lián)盟電信標(biāo)準(zhǔn)部(ITU-T)、歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)(ETSI)、北美電信工業(yè)協(xié)會(huì)(TIA)、日本的無(wú)線電系統(tǒng)研究和開(kāi)發(fā)中心(RCR)、管理全世界地球同步通信衛(wèi)星的國(guó)際海事衛(wèi)星公司(INMARSAT)、制定保密電話語(yǔ)音編碼標(biāo)準(zhǔn)的美國(guó)政府和北大西洋公約組織(NATO)等。他們研究制定了在電話通信中的語(yǔ)音編碼標(biāo)準(zhǔn),并得到了很好的應(yīng)用。
1、ITU-T語(yǔ)音編碼標(biāo)準(zhǔn)
傳統(tǒng)上ITU-T主要是為8 kHz采樣率和3.4 kHz帶寬的PSTN電話制定的語(yǔ)音編碼標(biāo)準(zhǔn),目的是借助數(shù)字電路的多路復(fù)用技術(shù)來(lái)提高通信網(wǎng)的容量。同時(shí),ITU-T也制定了16kHz采樣率和7kHz帶寬的語(yǔ)音編碼標(biāo)準(zhǔn),目的是實(shí)現(xiàn)ISDN、無(wú)線移動(dòng)通信網(wǎng)和IP網(wǎng)的互通和兼容。
1972年,ITU-T發(fā)布了A/μ律64kb/s PMC(Pulse Code Modulation)語(yǔ)音編碼標(biāo)準(zhǔn)G.711。該標(biāo)準(zhǔn)的基本思想是,先將8 kHz采樣率的離散語(yǔ)音樣點(diǎn)變換到對(duì)數(shù)域,然后對(duì)變換的語(yǔ)音樣點(diǎn)進(jìn)行8bit量化編碼。作為第一個(gè)數(shù)字電話系統(tǒng),G.711已經(jīng)配置在世界上不同的PSTN中,得到了非常廣泛的應(yīng)用。從那時(shí)起,ITU-T開(kāi)始制定更復(fù)雜的G.72x系列語(yǔ)音編碼標(biāo)準(zhǔn),頒布了G.721 32kb/s ADPCM(Adaptive Differential Pulse Code Modulation)編碼標(biāo)準(zhǔn)及其擴(kuò)展標(biāo)準(zhǔn)G.726 (40/32/24/16 kb/s),并最終用G.726取代了G.721。除了G.723.1,ITU-T的每個(gè)語(yǔ)音編碼器都是以前一個(gè)標(biāo)準(zhǔn)的半速率為基礎(chǔ)進(jìn)行開(kāi)發(fā)的,例如,1992年和1996年頒布的G.728和G.729語(yǔ)音編碼器的速率分別為16kb/s和8kb/s。另外,ITU-T還頒布了用于可視電話的5.3/6.3kb/s雙速率語(yǔ)音編碼標(biāo)準(zhǔn)G.723.1。G.728、G.729和G.723.1的編碼原理均基于碼激勵(lì)線性預(yù)測(cè)(Code Excited Linear Prediction,CELP)技術(shù)。為了支持非連續(xù)傳輸,ITU-T還分別公布了G.729和G.723.1的擴(kuò)展標(biāo)準(zhǔn)G.729B和G.723.1A。基于它們的靜默壓縮方案,這些標(biāo)準(zhǔn)已廣泛應(yīng)用于包交換的語(yǔ)音通信中。表1概括了ITU-T窄帶語(yǔ)音編碼標(biāo)準(zhǔn)。
表1:ITU-T窄帶語(yǔ)音編碼標(biāo)準(zhǔn)
欲更多了解ITU-T語(yǔ)音編碼標(biāo)準(zhǔn)介紹的請(qǐng)進(jìn)入。
2、歐洲數(shù)字蜂窩電話語(yǔ)音編碼標(biāo)準(zhǔn)
隨著數(shù)字蜂窩電話的出現(xiàn),歐洲電信標(biāo)準(zhǔn)協(xié)會(huì)(ETSI)制定了許多語(yǔ)音編碼標(biāo)準(zhǔn)。ETSI相繼公布了13kb/s GSM全速率(Full Rate,FR)語(yǔ)音編碼標(biāo)準(zhǔn)、5.6kb/s GSM半速率(Half Rate,HR)語(yǔ)音編碼標(biāo)準(zhǔn)和12.2kb/s GSM增強(qiáng)的全速率(Enhanced Full Rate,EFR)語(yǔ)音編碼標(biāo)準(zhǔn)。繼這三種標(biāo)準(zhǔn)之后,ETSI又公布了一種自適應(yīng)多速率(Adaptive Multi-Rate,AMR)語(yǔ)音編碼標(biāo)準(zhǔn),該標(biāo)準(zhǔn)共有8種速率(從12.2kb/s到4.75kb/s),其中4個(gè)速率用于全速率信道,而另外4個(gè)速率用于半速率信道。AMR編碼器的目的是根據(jù)信源編碼和信道編碼間的最佳選擇提供增強(qiáng)的語(yǔ)音質(zhì)量,在高的無(wú)線干擾時(shí),為保障語(yǔ)音質(zhì)量,AMR能夠自動(dòng)減少信源編碼比特?cái)?shù),并將富裕的比特?cái)?shù)補(bǔ)充到信道編碼中,反之亦然。ETSI語(yǔ)音編碼器也能夠借助于話音激活檢測(cè)進(jìn)行靜默壓縮,這非常有利于減少移動(dòng)通信中的信道干擾和延長(zhǎng)電池壽命。表2概括了歐洲移動(dòng)通信中使用的標(biāo)準(zhǔn)語(yǔ)音編碼器。
表2:用于GSM移動(dòng)通信的ETSI語(yǔ)音編碼標(biāo)準(zhǔn)
欲更多了解GSM系統(tǒng)語(yǔ)音編碼介紹的請(qǐng)進(jìn)入。
3、北美數(shù)字蜂窩電話語(yǔ)音編碼標(biāo)準(zhǔn)
在北美,電子工業(yè)協(xié)會(huì)(Electronic Industries Association,EIA)下屬的北美電信工業(yè)協(xié)會(huì)(TIA)根據(jù)美國(guó)使用的碼分多址(CDMA)和時(shí)分多址(TDMA)技術(shù)對(duì)其移動(dòng)通信進(jìn)行了標(biāo)準(zhǔn)化。1993年,TIA/EIA采納了Qualcomm CELP(QCELP)作為過(guò)渡語(yǔ)音編碼標(biāo)準(zhǔn)IS-96-A(Interim Standard-96-A),該標(biāo)準(zhǔn)對(duì)語(yǔ)音信號(hào)進(jìn)行8kb/s到0.8kb/s的變速率編碼。1995年,TIA/EIA在IS-96-A的基礎(chǔ)上頒布了一個(gè)稱為IS-127的增強(qiáng)型變速率(Enhanced Variable Rate Coder,EVRC)語(yǔ)音編碼標(biāo)準(zhǔn),該標(biāo)準(zhǔn)在語(yǔ)音壓縮模塊的前端引入了一個(gè)新穎的語(yǔ)音增強(qiáng)功能,在噪聲背景條件下,獲得了更加舒適的語(yǔ)音質(zhì)量。 1998年,TIA/EIA公布了用于個(gè)人通信系統(tǒng)的變速率語(yǔ)音編碼標(biāo)準(zhǔn)IS-733,該標(biāo)準(zhǔn)的速率介于14.4kb/s和1.8kb/s之間。1989年和1996年,TIA/EIA又分別頒布了用于北美TDMA的7.95kb/s全速率語(yǔ)音編碼標(biāo)準(zhǔn)IS-54和增強(qiáng)的全速率語(yǔ)音編碼標(biāo)準(zhǔn)IS-641-A。表3概括了北美移動(dòng)通信中使用的標(biāo)準(zhǔn)語(yǔ)音編碼器。
表3:用于北美CDMA/TDMA移動(dòng)通信的TIA/EIA語(yǔ)音編碼標(biāo)準(zhǔn)
欲更多了解CDMA系統(tǒng)語(yǔ)音編碼介紹的請(qǐng)進(jìn)入。
4、日本數(shù)字蜂窩電話語(yǔ)音編碼標(biāo)準(zhǔn)
日本數(shù)字蜂窩(Japanese Digital Cellular,JDC)電話標(biāo)準(zhǔn)由日本的無(wú)線電系統(tǒng)研究和開(kāi)發(fā)中心(Research and Development Center for Radio System,RCR)進(jìn)行標(biāo)準(zhǔn)化,作為日本的TDMA數(shù)字移動(dòng)電話語(yǔ)音編碼標(biāo)準(zhǔn)。1990年,RCR公布了一種類似于IS-54的6.7kb/s VSELP編碼器作為JDC的全速率語(yǔ)音編碼標(biāo)準(zhǔn)。為了使日本TDMA個(gè)人數(shù)字移動(dòng)系統(tǒng)(Personal Digital Cellular,PDC)的容量增加一倍,1993年RCR又公布了JDC 3.6kb/s基音同步更新碼激勵(lì)線性預(yù)測(cè)(Pitch Synchronous Innovation-Code Excited Linear Prediction,PSI-CELP)編碼器作為JDC的半速率語(yǔ)音編碼標(biāo)準(zhǔn)。表4概括了JDC語(yǔ)音編碼標(biāo)準(zhǔn)。
表4:JDC語(yǔ)音編碼標(biāo)準(zhǔn)
5、保密通信電話語(yǔ)音編碼標(biāo)準(zhǔn)
語(yǔ)音編碼是保密通信系統(tǒng)中至關(guān)重要的一部分,在突發(fā)事件中,為了傳達(dá)準(zhǔn)確的語(yǔ)音命令,語(yǔ)音編碼器的可懂度是一個(gè)主要的考慮對(duì)象。比較有影響力的保密通信的語(yǔ)音編碼標(biāo)準(zhǔn)主要由美國(guó)國(guó)防部(Department of Defense,DoD)組織制定。1984年和1991年,DoD分別頒布了稱之為2.4kb/s LPC-10e編碼器和4.8kb/s CELP編碼器的聯(lián)邦標(biāo)準(zhǔn)FS-1015(Federal Standard 1015)和FS-1016。后來(lái)DoD的保密電話標(biāo)準(zhǔn)是基于正弦語(yǔ)音編碼模型的2.4kb/s混合激勵(lì)線性預(yù)測(cè)(Mixed Excitation Linear Prediction,MELP)聲碼器(Vocoder),2.4kb/s DoD MELP語(yǔ)音編碼器在半速率情況下給出了好于4.8kb/s FS-1016編碼器的語(yǔ)音質(zhì)量。一個(gè)修正和改進(jìn)的2.4/1.2kb/s MELP編碼器已經(jīng)成為北大西洋公約組織(North Atlantic Treaty Organization,NATO)的保密電話標(biāo)準(zhǔn),該標(biāo)準(zhǔn)在編碼前端使用了一個(gè)噪聲預(yù)處理器。由于MELP編碼器能在非常低的比特率產(chǎn)生可懂的語(yǔ)音質(zhì)量,因此這類參數(shù)編碼器已廣泛使用在保密通信系統(tǒng)中。表5概括了DoD的標(biāo)準(zhǔn)語(yǔ)音編碼器。
表5:DoD語(yǔ)音編碼標(biāo)準(zhǔn)
6、衛(wèi)星電話語(yǔ)音編碼標(biāo)準(zhǔn)
國(guó)際海事衛(wèi)星公司(INMARSAT)已經(jīng)采用了兩種語(yǔ)音編碼器用于衛(wèi)星通信。INMARSAT分別將4.15kb/s改進(jìn)的多帶激勵(lì)(Improved Multiband Excitation,IMBE)語(yǔ)音編碼器和3.6kb/s先進(jìn)的多帶激勵(lì)(Advanced Multiband Excitation,AMBE)語(yǔ)音編碼器用在了INMARSAT M系統(tǒng)和INMARSAT Mini-M系統(tǒng)中。表6概括了INMARSAT的標(biāo)準(zhǔn)語(yǔ)音編碼器。
表6:INMARSAT語(yǔ)音編碼標(biāo)準(zhǔn)
7、各種語(yǔ)音編碼器的性能比較
為了選擇一個(gè)最佳的語(yǔ)音編碼器,必須針對(duì)某一應(yīng)用對(duì)象進(jìn)行廣泛的測(cè)試。一般來(lái)講,降低比特率將導(dǎo)致編碼語(yǔ)音質(zhì)量的下降。傳統(tǒng)的信噪比(SNR)質(zhì)量測(cè)量方法可以用來(lái)評(píng)價(jià)編碼速率為16kb/s以上的波形編碼器,因?yàn)檫@類編碼器的輸出信號(hào)波形與原始信號(hào)波形具有非常強(qiáng)的類似性。而低比特參數(shù)編碼器沒(méi)有保留波形類似性,基于SNR的質(zhì)量測(cè)量方法失去了意義。對(duì)于參數(shù)編碼器而言,基于感性MOS分的主觀質(zhì)量測(cè)量更可靠。表7通過(guò)比特率、算法、延時(shí)和MOS分比較了眾所周知的窄帶語(yǔ)音編碼標(biāo)準(zhǔn)。圖7以語(yǔ)音質(zhì)量相對(duì)比特率的形式說(shuō)明了這些標(biāo)準(zhǔn)的性能。在圖7中,128kb/s線性PCM(8kHz采樣率,每樣點(diǎn)用16bit量化編碼)提供了透明的語(yǔ)音質(zhì)量,64kb/s壓擴(kuò)PCM(8kHz采樣率,每樣點(diǎn)用8bit量化編碼)的MOS分值大于4,提供了長(zhǎng)途質(zhì)量,64kb/s PCM是這些標(biāo)準(zhǔn)中語(yǔ)音質(zhì)量最好的編碼器。
表7:窄帶語(yǔ)音編碼標(biāo)準(zhǔn)比較
圖7:窄帶語(yǔ)音編碼標(biāo)準(zhǔn)的性能比較
欲進(jìn)一步了解上述語(yǔ)音編碼標(biāo)準(zhǔn)的編碼器的技術(shù)性能的請(qǐng)進(jìn)入。