音樂在因特網上可以以不同的文件格式如AU、WAV或AIFF進行編碼和傳輸。在因特網上上傳和下載這樣的寬帶文件不能很令人滿意。如一個3min CD音樂(31.7MB),若通過一個56kbit/s調制解調器,則需要一個小時或更多的時間下載;最有效的方法是通過數據壓縮算法將文件壓縮,從而使音樂傳輸得更快。在理想條件下,比特率在96kbit/s以下就可以提供高質量的立體聲節目,比特率為64kbit/s就可以提供質量相當不錯的立體聲,為16kbitls可以提供單聲道音樂。在上面任何一種情況下,采用的算法必須能滿足實時節目,依靠壓縮率,可以有效地下載或實時播放音樂。
1、關于MP3
MP3是由活動圖象專家組(Moving Picture Coding Experts Group,MPEG)開發的音頻壓縮的技術。它的全稱是MPEG Audio Layer 3,就是活動圖像壓縮標準音頻層3的意思。因為它是利用了MPEG音頻3層的技術,將聲音壓縮到頻帶只有原來的1/10到1/12,但是人耳聽起來仍然音質很好。由于MP3具有壓縮程度高、音質好的突出優點,因而MP3是目前最為流行的一種音樂文件,各種媒體播放器都力圖做到具有MP3的播放功能。
MPEG數據壓縮算法在文件壓縮方面比電子分類應用更加廣泛。例如,文件可以在因特網上上傳或下載,或附加在電子郵件中。在這種應用中,第III層算法就是被人們所共知的MP3。MP3的好處在于大幅降低數字聲音文件的容量,而不會破壞原來的音質。以CD音質的Wave文件來說,如抽樣分辨率為16bit,抽樣頻率44.1kHz,聲音模式為立體聲,那么存儲1秒鐘CD音質的Wave文件,必須要用16 bit×44100Hz×2Stereo=1411200bit,也就是相當于1411.2kbits的存儲容量,存儲介質的負擔相當大。不過通過MP3格式壓縮后,文件便可壓縮為原來的1/10到1/12。每1秒鐘的MP3只需大約112~128kbits就可以了。具體數據可以參看下面的1-1和1-2兩個表。
表1-1:MPEG的壓縮等級(L1~L3)與壓縮比率
表1-2:聲音品質與MP3壓縮比例關系
MP3文件可以存儲在硬盤中、記錄在CD-ROM中或存儲在應用閃存的固態播放器中。上面的任何一種情況,數據都必須通過MP3節目器進行錄音重放。MP3算法不代表加密或復制保護,因此,它的內容會被復制。許多共享軟件和商業軟件程序都可以將音樂文件轉換成編碼的MP3文件,再在PC上對MP3文件解碼。在大多數情況下,在硬盤上首次存儲時是作為WAV或AIFF文件存儲的,再用專門的硬件或軟件壓縮成MP3文件。大多數編碼器可以實現不同級別的壓縮,例如,允許實現28.8kbit/s、64kbit/s、112kbit/s、128kbit/s、192kbit/s和320kbit/s這些不等的傳輸速率。高比特率可以用44.1kHz的采樣頻率提供立體聲錄音重放,而低一點的比特率就不能提供。例如,28.8kbit/s速率可用16kHz采樣頻率產生單信號。MP3能在96kbit/s的比特率下提供好的效果。盡管MP3與其他一些編解碼相比引入了更長的編碼延遲,但這并不重要,因為它和因特網固有的傳輸延遲相比是微不足道的。MPEG編碼不提供糾錯,若要求糾錯,則必須提供額外的信道編碼。一般來講,這種要求在網絡應用中是不常見的,但是,將CRC校驗與MPEG數據一起傳輸,可以對大多數敏感的數據進行檢錯,并可以進行錯誤隱藏(不是錯誤糾正),例如,將損壞的幀隱藏,并重發。
MP3文件可以用專門的硬件芯片或軟件程序解碼。為了優化操作,減少計算量,一些軟件解碼器具備特殊的性能。混頻合成過濾器組的計算是解碼器最復雜的計算方面。應用立體聲下混合時,可以將上述過程簡單化為頻域范圍內的單一值,然后再進入過濾器組,這樣只需要一個過濾器。下混合可以用一個簡單而有力的左、右聲道組合實現,但這不是個優化的方法,因為像MS立體聲或加重立體聲這樣的信號總是包含很強的信號。所以更為有效的辦法是用內置下混合程序,只計算在左、右立體聲中編碼的比例因子段中的信號,才于MS和加重編碼的比例因子段,程序只對其縮放比例。
為了進一步降低計算的復雜性,可以對混頻合成過濾器組進行優化。過濾器組由反向限制離散余弦變換(IMDCT )和多相過濾器組組成。IMDCT對18個頻譜值執行32次運算,每次將576個頻譜轉化成18個長度為32的連續頻譜。這些頻譜通過混頻合成過濾器且執行18次運算轉換到時域。混合過濾器組包括一個頻率映射操作(如矩陣乘法)和一個有512個系數的FIR濾波器。FIR濾波器計算可以通過減少系數的數量來降低計算的復雜性,濾波器系數可以在脈沖響應的末端刪減,脈沖響應可以以更少的系數進行調制。試驗證明,濾波器長度可以縮短25%而不必給予額外的補償。更直接地說,計算可以通過限制音頻帶寬的辦法加以簡化。高頻頻譜值可以置零,輸入、采樣值都置零的IMDCT可以不必計算。如果只有低于半數的IMDCT被計算,音頻帶寬則被限制。輸出值可以被兩個因子采樣,這樣會遺漏對每一秒輸出值的計算,從而將FIR計算減少了一半。
許多公司生產便攜的閃存播放器,這些播放器可以從主機下載MP3文件,通過一個隨機攜帶的MP3解碼器實現錄音重發。數據存儲在智能媒體、壓縮閃存、多媒體卡或其他不易丟失的存儲組件中。MP3可將一個典型的歌曲壓縮成大約5MB,從而可以使歌曲在5min內通過調制解調器下載,還可以提供高質量的音頻。MP3文件可以以不同速率編碼,相應下載時間或快或慢。然而,對于不同的解碼格式是不能升級的。換句話說,解碼器不能有選擇地挑選整個比特流的子集使之再生不同質量的信號。
通過因特網傳輸音樂MP3是個很好的選擇。它的好處也導致一些人對它濫用,有人非法去地將盜版音樂的MP3文件貼在他們的主頁上,讓大家自由下載。
2、關于MP4
MP4并不是MPEG-4或者MPEG-1 Layer 4,它的出現是針對MP3的大眾化、無版權的一種保護格式,由美國網絡技術公司開發,美國唱片行業聯合會倡導公布的一種新的網絡下載和音樂播放格式。
從技術上講,MP4使用的是MPEG-2 AAC技術也就是俗稱的alb或AAC o其中,MPEG-2是MPEG于1994年11月針對數碼電視(數碼影像)提出的。它的特點就是,音質更加完美而壓縮比更加大(1﹕15)。MPEG-2 AAC(ISO/IEC 13818-7)在采樣率為8~96KHz下提供了1~48個聲道可選范圍的高質量音頻編碼。AAC就是Advanced Audio Coding(先進音頻編碼)的意思,適用于從比特率在8kbit/s單聲道的電話音質到160kbit/s多聲道的超高質量音頻范圍內的編碼,并且允許對多媒體進行編碼/解碼。AAC與MP3相比,增加了諸如對立體聲的完美再現、比特流效果音掃描、多媒體控制、降噪優異等MP3沒有的特性,使得在音頻壓縮后仍能完美的再現CD音質。
AAC技術主要由以下3個部分組成:第一,AT&T的音頻壓縮技術專利,它可以將AAC壓縮比提高到20﹕1而不損失音質,這樣,一首3分鐘的歌僅僅需要2.25MB,這在互聯網上的下載速度是很驚人的;第二,安全數據庫,它可以為AAC Music創建一個特定的密鑰,將此密鑰存于其數據庫中,同時,只有AAC的播放器才能播放含有這種密鑰的音樂;第三,協議認證,這個認證包含了復制許可、允許復制副本數目、歌曲總時間、歌曲可以播放時間以及售賣許可等信息。它的工作原理如下:首先認證該歌曲內部的密鑰,然后核實安全數據庫中的密鑰并找到其許可協議。這樣就決定了歌曲以何種形式播放以及是否可以拷貝、販賣。同時,數據庫中的許可協議可以應用戶要求隨時修改,使得AAC歌曲本身包含的版權信息也可以隨時更換。這是一種融合了版權的音樂技術,解決了MP3帶來的版權沖擊問題。
MP4技術的優越性要遠遠高于MP3,因為它更適合多媒體技術的發展以及視聽欣賞的需求。但是,MP4是一種商品,它利用改良后的MPEG-2 AAC技術并強加上由出版公司直接授權的知識產權協議作為新的標準;而MP3是一種自由音樂格式,任何人都可以自由使用。此外,MP4實際上是由音樂出版界聯合授意的官方標準;MP3則是廣為流傳的民間標準。相比之下,MP3的靈活和自由度要遠遠大于MP4,這使得音樂發燒友們更傾向于使用MP3。更重要的一點是,MP3是目前最為流行的一種音樂格式,它占據著大量的網絡資源,這使得MP4的推廣普及難上加難。長遠來看,MP4的流行是遲早的事(指其優越的技術性)。但是如果MP4不改進其技術構成(即強加的版權信息)的話,那么當自由的MP3使用了MPFG-2 AAC的技術后,勝負就很明顯了。
欲更多了解其他音頻壓縮格式的請進入。