在語音編碼技術中,合成語音質量可以說是語音編碼性能的最根本指標。評價合成語音質量的方法很多,多年來人們提出的許多方法歸納起來可以分為主觀評價方法和客觀評價方法兩類。常用的主觀評價方法有3種:平均意見得分(MOS)、判斷韻字測試(DRT)和判斷滿意度測量(DAM)。客觀評價常采用改進的巴克譜失真測度(MBSD)評價方法。對于低速率(4.8Kb/s以下)語音編碼技術常采用激勵型線性預測編碼算法。下面給出幾種低速率(4.8Kb/s以下)語音編碼技術的合成語音質量的主觀和客觀評價指標,它們是LPC-10(二元激勵線性預測語音編碼)、FS-1016(碼激勵線性預測語音編碼)、AMR(混合激勵線性預測語音編碼)、新FS-1015(混合激勵線性預測語音編碼)和INMAARSA-M(改進型多帶激勵語音編碼)5種編碼標準。
1、主觀評價指標
表1分別給出了上述5種編碼標準聲碼器在無噪聲時的主觀評價(MOS、DRT和DAM)測試結果。
表1:5種編碼標準聲碼器在無噪聲時的合成語音質量主觀測試結果
2、客觀評價指標
改進的巴克譜失真測度(MBSD)評價方法的條件是:測試語音文件的噪聲電平分別為無噪聲、電平為15dB、噪聲電平為20dB,輸入語音電平分別為-9dB、-19dB、-29dB,每個輸入電平4個文件(男女聲各占1/2),與噪聲電平組合為36個測試文件。平均MBSD的測試結果詳見下表2-1~表2-5。表中的噪聲電平是對噪聲幅度直接取對數得到的,輸入電平是對輸入語音信號幅度歸一化后再取對數得到的。
表2-1:LPC-10聲碼器合成語音質量客觀測試的平均MBSD測試結果
表2-2:FS-1016標準語音編碼器合成語音質量客觀測試的平均MBSD測試結果
表2-3:AMR標準4.75kb/s語音編碼器合成語音質量客觀測試的平均MBSD測試結果
表2-4:新FS-1015標準語音編碼器合成語音質量客觀測試的平均MBSD測試結果
表2-5:INMARSAT-M標準語音編碼器合成語音質量客觀測試的平均MBSD測試結果
由表中的測試結果可知:噪聲電平越大,其MBSD的值也越大,即噪聲越強,合成語音失真越大,這與實際是相吻合的。
欲更多了解語音編碼性能評價指標概念的請進入。