隨著通信技術(shù)的發(fā)展,近幾十年來出現(xiàn)了許多語音及音頻編碼技術(shù)和算法。由于通信技術(shù)的發(fā)展對語音編碼不斷提出新的要求,同時隨著語音及音頻編碼技術(shù)的不斷成熟,在這一時期產(chǎn)生了一系列語音及音頻編碼的國際標(biāo)準(zhǔn)和地區(qū)標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)不但反映了語音及音頻編碼技術(shù)的發(fā)展歷程和現(xiàn)狀,也反映出語音及音頻編碼技術(shù)的發(fā)展趨勢和方向。
下面對相關(guān)已標(biāo)準(zhǔn)化的語音及音頻編碼技術(shù)進行簡單比較。主要是針對其編碼速率、語音質(zhì)量、時間復(fù)雜度(MIPS)、空間復(fù)雜度(RAM)、幀的長度、預(yù)留時間、編碼算法類型等參數(shù)。
一、ITU-T的電話語音編碼標(biāo)準(zhǔn)
ITU-T 制定了一系列主要是應(yīng)用于電話通信語音編碼的標(biāo)準(zhǔn)(G.7xx系列)。ITU-T主要是由第15研究組(SG 15)負(fù)責(zé)語音標(biāo)準(zhǔn)的制定,其他一些研究組也提出一些特殊應(yīng)用的語音標(biāo)準(zhǔn)。SG 15負(fù)責(zé)建立參考條款(ITU-T的內(nèi)部文件)的總體責(zé)任,SG 12的語音質(zhì)量專家組(SQEG)協(xié)助SG 15制定語音質(zhì)量的目標(biāo)并負(fù)責(zé)設(shè)計和指導(dǎo)實驗程序,確定候選的編碼器是否符合要求。
ITU-T制定的各種電話通信語音編碼技術(shù),主要是上世紀(jì)末階段,首先在1972年頒布了G.711的PCM編碼標(biāo)準(zhǔn)(64kbit/s),到1998年公布的4kbit/s 編碼標(biāo)準(zhǔn)。ITU-T于1994年前和1995年后陸續(xù)公布的電話帶寬語音編碼標(biāo)準(zhǔn)分別詳見下表1-1和1-2,1995年后陸續(xù)公布的電話帶寬語音編碼標(biāo)準(zhǔn)的編碼速率將更低。ITU-T制定的音頻編碼技術(shù)不多(有G.722、G.725),主要研究制定的是電話通信的語音編碼技術(shù)。
表1-1:ITU-T于1994年前公布的電話語音編碼標(biāo)準(zhǔn)的參數(shù)
表1-2:ITU-T于1995年后公布的電話帶寬語音編碼標(biāo)準(zhǔn)的參數(shù)
欲進一步了解ITU-T G.7xx系列建議介紹的請進入。
二、關(guān)于移動通信語音編碼技術(shù)
1、北美數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)
美國TIA的TR-45分會主要負(fù)責(zé)制定北美數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn),TR-30分會負(fù)責(zé)同時具有聲音和數(shù)據(jù)的調(diào)制解調(diào)標(biāo)準(zhǔn)。北美數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)詳見下表2-1所示。
表2-1:北美數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)的參數(shù)
2、歐洲數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)
歐洲電信標(biāo)準(zhǔn)化協(xié)會(ETSI)對語音編碼有很大影響的一個例子就是TCS-HS。這個實體就是在1987年制定了全歐數(shù)字蜂窩移動通信TDMA標(biāo)準(zhǔn)GSM,GSM采用ETSI規(guī)范的13kb/s速率的長時預(yù)測-規(guī)則脈沖激勵線性預(yù)測語音編碼標(biāo)準(zhǔn),后來TCH-HS又提出了一個“半速率”語音編碼標(biāo)準(zhǔn),其系統(tǒng)容量是原來系統(tǒng)的2倍。歐洲數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)如表2-2所示。
表2-2:歐洲數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)的參數(shù)
3、日本的數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)
日本的RCR負(fù)責(zé)制定了日本的數(shù)字蜂窩移動通信語音編碼。日本的數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)詳見下表2-3。
表2-3:日本的數(shù)字蜂窩移動通信語音編碼標(biāo)準(zhǔn)的參數(shù)
三、國際海事衛(wèi)星組織的衛(wèi)星通信語音編碼標(biāo)準(zhǔn)
國際海事衛(wèi)星組織(INMARSAT)于1990年公布了應(yīng)用于衛(wèi)星通信的IMBE(改進型多帶激勵編碼)4.15kb/s語音編碼標(biāo)準(zhǔn)。具體詳見下表3-1。
表3-1:國際海事衛(wèi)星組織公布的4.15 kb/s的IMBE語音編碼標(biāo)準(zhǔn)的參數(shù)
四、美國的保密通信語音編碼標(biāo)準(zhǔn)
為了保密通信,美國的DOD制定了一系列應(yīng)用美國的保密通信的語音編碼標(biāo)準(zhǔn),具體詳見下表4-1。
表4-1:美國的保密通信語音編碼標(biāo)準(zhǔn)的參數(shù)
五、ISO的多媒體應(yīng)用的音頻壓縮編碼標(biāo)準(zhǔn)
近年來隨著功能強大、價格便宜的個人計算機進入千家萬戶,多媒體的應(yīng)用愈來愈廣泛。在多媒體用領(lǐng)域中,文本、圖象、電視、電影和聲音都被存儲在計算機中,然后再顯示、編輯和回放。ISO在對多媒體數(shù)據(jù)進行MPEG壓縮和處理時,對音頻的壓縮已經(jīng)成為MPEG視頻壓縮中不可分割的一部分。這里的對音頻的壓縮編碼,與前述的幾種語音編碼技術(shù)不同的是,前述的幾種語音編碼技術(shù)主要是對話音頻帶(300 Hz~3400Hz)進行壓縮編碼,而ISO的MPEG的音頻壓縮編碼是對聲音頻帶的編碼,我們知道人耳能聽到的聲音頻率范圍大約為20 Hz~22000Hz。
1、MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)
ISO/IEC 11172-3標(biāo)準(zhǔn)是MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)。此標(biāo)準(zhǔn)規(guī)定了MPEG-1音頻層數(shù)據(jù)壓縮編碼的方法。標(biāo)準(zhǔn)中有三個處理級別,分別稱為第Ⅰ、Ⅱ、Ⅲ層,第Ⅰ層是基本模式,其余兩層有更多的處理,因而在相同的聽覺質(zhì)量下,將會有更高的壓縮效率。
此標(biāo)準(zhǔn)主要用于一般音頻信號的處理,特別是與各種數(shù)字視頻應(yīng)用有關(guān)的音頻信號的處理。MPEG-1可以提供取樣頻率為32 kHz、44.1 kHz和48 kHz的單聲道或立體聲。表5-1給出了第Ⅰ、Ⅱ、Ⅲ層的性能和應(yīng)用領(lǐng)域。可見,由第Ⅰ層到第Ⅲ層壓縮效率和聽覺質(zhì)量逐層提高。第Ⅲ層的壓縮算法我們常稱之為MP3。表5-2給出了MPEG-1音頻第Ⅰ、Ⅱ?qū)訁?shù)的比較。
表5-1:MPEG-1音頻第Ⅰ、Ⅱ、Ⅲ層音頻編碼的參數(shù)
表5-2:MPEG-1音頻第Ⅰ、Ⅱ?qū)訁?shù)的比較
2、MPEG-2音頻壓縮編碼標(biāo)準(zhǔn)
ISO/IEC 13818-3標(biāo)準(zhǔn)是MPEG-2音頻壓縮編碼標(biāo)準(zhǔn)。此標(biāo)準(zhǔn)是MPEG委員會在1994年11月通過的。MPEG-2音頻壓縮的應(yīng)用范圍包括數(shù)字HDTV電視節(jié)目的發(fā)送以及從因特網(wǎng)上的下載等。它可以向后兼容多聲道聲音、低取樣率以及高級音頻編碼(AAC)這一類非向后兼容的多聲道聲音。
MPEG-2音頻壓縮編碼標(biāo)準(zhǔn)包括MPEG-1音頻壓縮編碼標(biāo)準(zhǔn)的第Ⅰ、Ⅱ、Ⅲ層,使用相同的編碼和譯碼原理。在許多情況下,為了應(yīng)用MPEG-1所設(shè)計的算法,也適用于MPEG-2。多聲道的MPEG-2音頻向后兼容MPEG-1。MPEG-2的譯碼器可以接收MPEG-1的比特流。MPEG-1的譯碼器可以從MPEG-2的比特流中得到立體聲。MPEG-2允許使用不兼容的音頻編碼器。MPEG-2可以提供取樣頻率為32 kHz、44.1 kHz和48 kHz的多聲道聲音。MPEG-2向后兼容MPEG-1,通常用BC表示向后兼容,則可以表示為MPEG-2BC。MPEG-2也支持取樣頻率為16 kHz、22.05 kHz和24 kHz的單聲道和立體聲編碼。
3、MPEG-4音頻壓縮編碼
MPEG-4用MPEG-2AAC和MPEG-4音頻編碼來支持高質(zhì)量單聲道、立體聲和多聲道信號的編碼。MPEG-4還特別針對非常低的比特率,例如針對64~2kb/s的自然音頻進行編碼。當(dāng)其使用變速率編碼時,甚至可以對低于 2 kb/s以下的自然音頻編碼,例如,可以對1.2 kb/s速率的音頻編碼。MPEG-4也支持中等質(zhì)量的音頻編碼。對于這一質(zhì)量等級的音頻信號,從使用8 kHz的取樣頻率開始。MPEG-4支持寬帶話音編碼、窄帶話音編碼、智能話音編碼、語音合成以及音頻合成。定義了4個音頻的分布圖,提供對極低比特率話音進行參數(shù)編碼的合音矢量激活編碼(HVXC)器、對窄帶/寬帶話音進行編碼的CELPC編碼器和一個文字到話音的接口。
欲更多了解關(guān)于語音編碼知識的請進入:相關(guān)標(biāo)準(zhǔn)化組織語音編碼標(biāo)準(zhǔn);常用的語音編碼的相關(guān)特性比較;按語音編碼速率分類的編碼技術(shù)比較