為了語音通信,相關標準化組織研究制定了一系列的語音編碼技術或方法,尤其是ITU-T制定的相關語音編碼技術更多,以G.7xx系列推出。語音編碼及壓縮的目的:一是為了將語音信息的模擬與數字之間的轉換;二是為了降低語音信息占用的帶寬。語音編碼算法(方式)有多種多樣,其分類方法頗多,歸納起來按傳統的分類可以分成三大類:波型編碼、參量編碼(也稱為分析--合成編碼)和混合編碼。這三類編碼算法的細分類、特點、編碼速率范圍等詳見下表0。下面就ITU-T的各種語音編碼技術(或方法)及其他一些標準化組織的相關語音編碼技術的一些性能進行比較,以了解各種技術或方法的特性。
表0:語音編碼算法的特點及細分類
欲了解相關各類語音壓縮編碼方式的中英文對照的請進入。
1、編碼速率、編碼延時與最小帶寬特性
ITU-T制定的相關語音編碼方式最多,有近十種之多。下表1-1給出了ITU-T建議的常用語音壓縮編碼及有關編碼速率、編碼延時等特性;下表1-2給出了各種語音編碼方法及其相應的傳輸速率和最小帶寬的要求。
表1-1:常用語音壓縮編碼的ITU-T建議及有關特性
表1-2:各種語音編碼方法及其相應的傳輸速率和最小帶寬的要求
編碼延時會增加話音端到端的通話時;傳輸速率和最小帶寬是要占用傳輸帶寬的。當然編碼速率與最小帶寬成正比,與編碼時延成反比。
2、編碼質量的主觀評價測定值
我們知道,語音編碼質量常采用主觀評定方法,常用的有MOS法、DRT法、DAM法,下表2給出了幾種類型語音編碼技術的MOS、DRT、DAM評定參考。語音編碼速率越高,其主觀評價測定值就越高。
表2:幾種語音編碼算法的質量評定參考
3、碼流特征分析
語音編碼的碼流特征分析是為了積累先驗知識,以加深對語音編譯碼系統的認識和理解,從而有益于對其碼流結構的認識和理解,有益于抓住其中反映本質的特征,有益于構造合適的譯碼方案,以還原出滿意的合成語音質量。下表3給出了常見語音編碼標準(共22種,包括ITU-T、ETSI、TIA、3GPP等標準化組織的語音編碼技術)碼流的幀結構的比較表;常見語音編碼標準(22種)碼流的零一變化率直方圖詳見附件3。
表3:常見語音編碼標準碼流的幀結構比較表
附件3:常見語音編碼標準碼流的零一變化率直方圖
欲了解各類已標準化的語音及音頻編碼技術的性能比較的請進入。
欲了解按語音編碼速率分類的國際標準編碼技術比較的請進入。
823.86KB