作者knives (大家都在補習阿)
看板AVEncode
標題[轉貼] MPEG2標準的壓縮分層和技術原理
時間Wed Mar 23 22:30:55 2005
http://www.donews.net/sbewcw/archive/2005/01/01/222645.aspx
從上面轉錄下來的
在多媒體信號傳輸中,只有對音頻和視頻信號進行有效的編碼,才能最後解析出高質量的
聲音和圖像。本文介紹了MPEG2標准的壓縮分層和編碼原理,並說明了如何在芯片上實現
MPEG2音頻編碼。
MPEG2 是當今最為流行的AV壓縮標准,可用于視頻、音頻和數字信息存儲。完整的MPEG2
標准可滿足STB等廣播應用和DVD或D-VHS等多媒體應用。 MPEG2並非對MPEG2編碼器進行標
准化,而是為經過MPEG2編碼的位流提供了一種標准化格式,另一方面,它也為MPEG2解碼
器提供了一個標准模式。
MPEG2標准的音頻部分大致基于MPEG1標准,因此二者兼容性很強。這一點使得現有的
MPEG1設備可對MPEG2信號中兼容MPEG1的部分信號進行解碼,而MPEG2設備也可解碼MPEG1
信號,從而實現前向兼容。
壓縮分層
MPEG2 和MPEG1音頻壓縮可分為三層。層數越高,壓縮的程度、所需CPU處理能力以及聲音
質量也相應增加;而傳輸所需的帶寬則相應減少。因此,第一層的壓縮率最低、所需CPU
處理能力最低、延遲也最少。由于壓縮率最低同時聲音質量最差,因此它所需的傳輸帶寬
最大。而第三層的聲音質量最佳,壓縮率可達1:10。處理時間也幾乎是第一層的三倍。表
1可很好地說明這一點。 表1:MPEG2和MPEG1音頻壓縮可分為三層。
之所以將壓縮分為三個層,一部分是基于需要,一部分則是歷史原因。
首先,它很大程度取決于所壓縮信號將用于哪種應用中。例如,當我們主要希望能再現高
品質的聲音,其次才關注處理能力/成本,那麼應選擇第三層。而如果主要考慮的是處理
能力和成本,則可選擇第一層或第二層。不過,如果選用的不是第三層,則聲音在重現時
會有所欠缺,因此,用戶必須權衡考慮,選擇適合于其特殊應用的那一層。
其次,壓縮層的概念是逐漸發展而來的。第三層規范比第一、二層定得晚。當第三層規范
開始流行時,采用第一、二層規范的設備已十分普及,消費者也非常熟悉了。因此,必須
讓消費者能自由地選擇適合自己應用的那一層規范。
MPEG2音頻壓縮及編碼
三層規范的音頻壓縮及編碼過程如圖1所示。濾波器組采用快速傅利葉變換(FFT)將時域采
樣轉換成同樣數目的頻域采樣。輸出是一系列帶寬相等的子帶。心理聲學模式過程計算每
一子帶的信號掩蔽比(SMR),以便決定每一子帶可用于編碼的信號位數。在信號位或噪聲
分配過程中,通過濾波器組的輸出及SMR信息來決定每個子帶可承受的量化噪聲。量化噪
聲越高,這一子帶所分配的信號位數就越低。在位流格式化模塊中,子帶頻率采樣與分配
給該層的信號位及一些其它信息相結合,形成一個音頻幀,這個幀包括一個信號頭和其它
信息段。 圖1:三層規范的音頻壓縮及編碼過程。
MPEG2音頻增強功能
與MPEG1相比,MPEG2在以下方面有所改善。
1. 半采樣率
在MPEG2中,僅需使用MPEG1中一半的采樣率便可保持極佳的聲音質量。這一點對評論頻道
、多語頻道及多媒體等應用尤其有益,這些頻道的頻率范圍為20Hz到20kHz,但極少使用
。
2. 多頻道擴展
MPEG2 支持5個音頻信道,共同實現一種「環繞」立體聲效果,以便獲得更為逼真的立體
聲。這5個信道分別是左信道(L)、右信道(R)、中央信道(C)、左後環繞信道(Ls)和右後環
繞信道(Rs)。這種情況下,在前面布置3個高音音箱,在後面布置2個,因此也可稱為3/2
立體聲。如圖2所示。 圖2:MPEG2支持5個音頻信道,共同實現一種「環繞」立體聲效果
,以便獲得更為逼真的立體聲。
在芯片上實現MPEG2音頻編碼
MPEG2 音頻編碼可以單獨或與MPEG2視頻編碼一起在硬件上實現。在後一種情況下需要增
加多路復用器或多路輸出選擇器,以進行相應的編碼或解碼;也可以采用一個編解碼器來
完成兩個功能。通常MPEG2音頻編碼是通過DSP來實現的,這種方案成本更低而且更為靈活
。MPEG2音頻解碼器芯片電路方塊圖如圖3所示。
許多電子設備廠商生產的MP3播放器中都有這一系統,並帶有MPEG2音頻第三層解碼器。一
些MP3播放器可存儲約1-2小時的音樂,這種情況下通常存儲在記憶棒或閃存中。帶有硬盤
的播放器則可存儲更多信息。圖3:MPEG2音頻解碼器芯片電路方塊圖。
如果要同時實現MPEG2音頻和視頻編碼,則兩種數據流的多路復用是一個關鍵問題。可以
在同一塊芯片上進行音頻和視頻信號編碼,也可以采用另一塊芯片。這一過程由ITU
13818-3標准控制,可選擇使用程序流(program stream)或傳輸流(transport stream)。
在多路復用的情況下,MPEG2音頻和視頻信號共用帶寬。除了音頻和視頻信號外,數據流
中還攜帶了有關兩種信號的合成信息。這種情況下,總的比特率(也稱為系統比特率)是音
頻和視頻信號比特率以及數據頭和字節填充的總和。顯然,視頻部分占用了大部分帶寬。
當系統比特率高時,音頻信號的比特率比視頻信號或多路復用數據流的比特率低。這種情
況下,由于帶寬十分丰富,因此用戶可對音頻流的各種參數進行設置以獲得最佳的聲音質
量。然而,如果比特率較低,情況就不太一樣。如果音頻部分稍稍浪費一些帶寬,視頻部
分的帶寬便會不夠用。最後解析出來的視頻質量便會嚴重受損。這種情況下應小心設置
MPEG2 音頻參數。如將「音頻PES調節」關閉,音頻比特率也應該降低到192kbps或甚至
128kbps。這些設置對改善MPEG2信息流解析質量十分有效。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 140.128.194.155