語音編碼為信源編碼,是將模擬信號轉變為數字信號,然后在信道中傳輸。在無線通信,特別是在數字移動通信中,語音編碼技術起著關鍵的作用,高質量低速率的語音編碼技術與高效率數字調制技術相結合,可以為數字移動網提供高于模擬移動網的系統容量。目前,語音編碼技術的研究方向有兩個:降低語音編碼速率和提高語音質量。
語音編碼技術有波形編碼、參量編碼和混合編碼三種類型。波形編碼是指在時域上對模擬語音的電壓波形按一定的速率抽樣,再將幅度量化,對每個量化點用代碼表示。解碼是相反過程,將接收的數字序列經解碼和濾波后恢復成模擬信號。波形編碼能提供很好的語音質量,但編碼信號的速率較高,一般應用在信號帶寬要求不高的通信中。脈沖編碼調制(PCM)和增量調制(ΔM)是常見的波形編碼,其編碼速率為16kb/s ~64kb/s。參量編碼又稱聲源編碼,是以發音模型作基礎,從模擬語音提取各個特征參量并進行量化編碼,可實現低速率語音編碼,達到2kb/s~4.8kb/s。但語音質量只能達到中等以下?;旌暇幋a是將波形編碼和參量編碼結合起來,既有波形編碼的高質量優點又有參量編碼的低速率優點。其壓縮比達到4kb/s~16kb/s。在移動通信和衛星通信系統中一般采用混合編碼技術?;旌暇幋a克服了原有波形編碼和參量編碼的弱點,結合了各自的長處,力圖保持波形編碼的高質量和參量編碼的低速率,又能獲得低速率上的高質量的合成語音。如規則脈沖激勵長期線性預測編碼RPE-LTP、Qualcomm碼激勵線性預測編碼QCELP等。另外,自適應差分脈沖編碼調制ADPCM也已成為語音編碼中常用的一種技術。
下面就幾種無線通信中典型的語音壓縮編碼技術做一介紹。
1、“小靈通”(PAS)的語音編碼
ADPCM語音壓縮編碼用于我國“小靈通”系統。ADPCM語音壓縮編碼即ITU-T的G. 721建議,是在1984年公布的。1986年作了進一步修訂。它用于64kb/s的A律或μ律PCM到32kb/s ADPCM之間的轉換,實現了對PCM信道的擴容(相應的設備叫數字電路倍增器DCME)。圖1是32kb/s ADPCM編碼器和解碼器簡化框圖。編碼器的輸入信號是64kb/s A律或μ律PCM編碼。首先將其轉換為標準PCM編碼,從中減去估計值,得到差值信號d(k)。15階自適應量化器將d(k)量化成4位二進制值I(k)。逆量化器從這4位二進制數中產生量化的差值信號dq(k)。dq(k)和估計信號Sq(k)相加得到重構信號ST (k)。自適應預測器利用dq(k)和ST (k)生成輸入信號的估計值。
圖1:ADPCM簡化框圖
解碼器包括一個與編碼器反饋部分相同的結構,還有A律或μ律的轉換器,以及同步編碼調節器。同步編碼器用于防止同步級聯編碼(ADPCM-PCM-ADPCM)在某些情況下產生累積失真。用試圖消除下一個ADPCM編碼的量化失真的方式調節PCM輸出,以實現同步編碼調節。
2、GSM的語音編碼
RPE-LTP(Regular Pulse Excited-Long Term Predition-Linear Predictive Coding)即RPE –LTP-LPC(規則脈沖激勵-長時預測-線性預測編碼),是泛歐第二代數字移動GSM系統所采用的語音編碼方案,純編碼速率為13kb/s,語音質量較好。
大家熟悉的PCM編碼采用A律波形編碼時,分為采樣、量化、編碼3步。用這種編碼方式,數字鏈路上的數字信號比特速率為64kb/s。如果GSM系統也采用此種方式進行語音編碼,那么每個語音信道是64kb/s,8個語音信道就是512kb/s。考慮實際可使用的帶寬,GSM規范中規定載頻間隔是200kHz。因此要把它們保持在規定的頻帶內,必需大大地降低每個語音信道的編碼的比特率,這就要靠改變語音編碼的方式來實現。
聲碼器(一種參量編碼)編碼可以是很低的速率(可以低于5kb/s),雖然不影響語音的可懂性,但語音的失真很大,很難分辨是誰在講話。波形編碼器語音質量較高,但要求的比特速率相應地較高。因此GSM系統語音編碼器是采用聲碼器和波形編碼器的混合--混合編碼器,全稱為線性預測編碼-長期預測編碼-規則脈沖激勵編碼器(LPC-LTP-RPE編碼器),如圖2所示。LPC+LTP為聲碼器,RPE為波形編碼器,再通過復用器混合完成模擬語音信號的數字編碼,每個語音信道的編碼速率為13kb/s。
聲碼器的原理是模仿人類發音器官喉、嘴、舌的組合、將該組合看作一個濾波器,人發出的聲音使聲帶振動就成為激勵脈沖。當然“濾波器”脈沖串頻率是在不斷地變換,但在很短的時間(l0ms~30ms)內觀察它,則發音器官是沒有變換的,因此聲碼器要做的事是將語音信號分成20ms的段(一個音節),然后分析這一時間段內所相應的濾波器的參數,并提取此時的脈沖串頻率,輸出其激勵脈沖序列。相繼的語音段是十分相似的,LTP將當前段與前一段進行比較,相應的差值被低通濾波后進行一種波形編碼。經過LPC+LTP編碼的碼速率為3. 6kb/s,RPE編碼的碼速率為9.4kb/s。因此,語音編碼器的輸出比特速率是13kb/s。
3、CDMA系統的語音編碼
CDMA系統如同其他數字式移動電話系統,它也采用語音壓縮編碼技術來降低語音的速率。CDMA系統的語音編碼主要有從線性預測編碼技術發展而來的激勵線性預測編碼QCELP和增強型可變速率編碼EVRC。目前13kb/s CELP語音編碼已達到有線長途的音質水平,我國已正式將CELP編碼列入CDMA標準中。總之CDMA系統中所使用的編碼技術是對現有編碼技術的有機組合和高效利用。
1)QCELP受激線性預測編碼
QualComm受激線性預測編碼(QualComm Code Excited Linear Predictive,QCELP),是美國Qualcomm通信公司的專利語音編碼算法,也是北美第二代數字移動電話(IS-95 CDMA)的語音編碼標準(IS-95)。這種算法不僅可工作于4/4.
2)CELP碼激勵線性預測編碼
CELP碼激勵線性預測編碼(Code Excited Linear Prediction,CELP)是近10年來最成功的語音編碼算法。CELP語音編碼算法用線性預測提取聲道參數,用一個包含許多典型的激勵矢量的碼本作為激勵參數,每次編碼時都在這個碼本中搜索一個最佳的激勵矢量,這個激勵矢量的編碼值就是這個序列的碼本中的序號。CELP已經被許多語音編碼標準所采用,美國聯邦標準FS1016就是采用CELP的編碼方法,主要用于高質量的窄帶語音保密通信。CELP是一個簡化的LPC算法,以其低比特率著稱(4800kb/s~9600kb/s),具有很清晰的語音品質和很高的背景噪聲免疫性。
CELP是一種在中低速率上廣泛使用的語音壓縮編碼方案。它綜合使用了線性預測、矢量量化、感覺加權、A-B-S(綜合分析法)等技術,在4kb/s~16kb/s的速率上,使電話寬帶語音編碼得到很高的編碼質量。編碼器的基本原理框圖如圖3所示。與LPC模型類似,CELP模型中也有激勵信號和聲道濾波器,但它的激勵信號不再是LPC模型中的二元激勵信號。在目前常用的CELP模型中,激勵信號來自兩個方面:長時基音預測器(又稱自適應碼本)和隨機碼本。自適應碼本被用來描述語音信號的周期性(基音信息)。固定的隨機碼本則被用來逼近語音信號經過短時和長時預測后的線性預測余量信號。從自適應碼本和隨機碼本中搜索出的最佳激勵矢量乘以各自的最佳增益后相加,便可得到激勵E(n)。它一方面被用來更新自適應碼本,另一方面則被輸入到合成濾波器H(z)以得到合成語音Š(n)。Š (n)與原始語音S(n)的誤差通過感覺加權濾波器W(z)后可得到感覺加權誤差信號e(n)。使e(n)均方誤差為最小的激勵矢量就是最佳激勵矢量。
圖3:CELP編碼原理框圖
CELP的解碼過程已經包含在編碼過程中。在解碼時,根據編碼傳輸過來的信息從自適應碼本和隨機碼本中找出最佳碼矢量,分別乘以各自的最佳增益并相加,可以得到激勵信號E(n),將E(n)輸入到合成濾波器H(z),便可得到合成語音Š (n)??梢钥闯?,搜索最佳激勵矢量是通過綜合出重建語音信號進行的。這種通過綜合來分析語音編碼參數的優化方法稱為綜合分析法,即A-B-S方法。采用這種方法明顯提高了合成語音的質量,但也使編碼運算量增加不少。固定碼本采用不同的結構形式,就構成了不同類型的CELP。例如采用代數碼本、多脈沖碼本、矢量和碼本的CELP分別稱為ACELP、MP-CELP和VSELP編碼。
對CELP來說關鍵是碼本,如果碼本編得好,就可以在低碼率下獲得較好的語音質量。隨著DSP技術的發展,這些成果得到了廣泛應用。如1989年通過的碼速率為13. 6kb/s,采用規則脈沖激勵長時預測算法的語音編碼標準,在誤碼率為10-3的GSM用信道中傳輸,語音質量不降低;而碼速率為5. 6kb/s的VSELP編碼則足以使現有的GSM擴容1倍。ITU于1995年下半年通過了具有長話音質的8kb/s編碼標準,它采用共扼結構代數(CSA-CELP)算法,將用于第三代移動通信系統;具有多種碼率的IS-96則是美國Qualcomm公司為CDMA研制的又一種CELP編碼??偟膩碚f,語音壓縮倍率越高,數碼率越低,編碼算法也越復雜,在實時壓縮的條件下就不可能用邏輯電路實現,也不會用體積大、速度慢、成本高的微機實現,此時DSP是一種合適的選擇。
欲了解更多語音編碼技術知識的請進入。