音頻信號(Audio signal)包括語音信號(sound signal)和其它聲音信號(如音樂),也可稱之為語聲信號。語聲信號的頻率有一定的范圍,且因人而異。統計結果表明:語聲的頻譜一般在80~8000Hz,人可以聽到的范圍為16~20000Hz。人耳的聽覺不正比于聲音功率的變化,而正比于聲音功率比值的對數,常用分貝表達感覺特性。語聲信號的能量主要集中在低頻段400~900Hz,低于500Hz的頻率成分的語聲平均能量下降6%,高于1500Hz以上頻率成分的語聲平均能量少于12%,因而在滿足語聲質量的前提下,為充分利用頻譜,宜減小信號傳輸速率。
ITU建議采用300~3400Hz的頻帶范圍,其中語音通信的清晰度可達90%,可懂度達100%,已被世界各國采用。ITU建議:單路電話通信的有效頻帶為3100Hz;多路電話通信時,考慮話路間的隔離,一個電話通路的占用頻帶為4000Hz,可獲得滿意的通信質量。
語聲的質量可用清晰度、可懂度、自然度(逼真度)等幾個指標進行衡量,下表1給出了這幾個指標的含義,若通信的帶寬受限,將會影響語聲傳輸的指標,表2給出了通信帶寬對語聲傳輸性能指標的影響情況(清晰度、可懂度)。
表1:語聲質量指標名稱的含義
表2:通信帶寬對語聲傳輸性能指標的影響
數字聲頻信號來自于對模擬信號進行抽樣和量化,國際上有兩種量化標準:A率13折線(中國、歐洲)和μ率15折線(美國、日本等),對音頻信號均可進行壓縮編碼,以提高傳輸效率,增大傳輸容量國際上制定的語聲壓縮編碼的主要國際標準,主要的詳見下表3。
表3:聲音壓縮編碼國際標準
語音的編碼速率可以用“比特/秒”(bit/s)來度量,她代表了編碼的總速率,通常用Ⅰ表示。編碼速率也可以用“比特/樣點”(b/s)來度量,它代表了平均每個語音樣點用多少個比特編碼,通常用R表示,Ⅰ和R可以通過采樣率fs聯系起來,即如下式。fs是根據采樣定理即信號帶寬決定的。目前國際上語音信號常用的帶寬及采樣率詳見下表4。
Ⅰ= R × fs
表4:數字音頻帶寬及采樣率
欲進一步了解ITU-T語音編碼標準介紹的請進入。