作者knives (大家都在补习阿)
看板AVEncode
标题[转贴] MPEG2标准的压缩分层和技术原理
时间Wed Mar 23 22:30:55 2005
http://www.donews.net/sbewcw/archive/2005/01/01/222645.aspx
从上面转录下来的
在多媒体信号传输中,只有对音频和视频信号进行有效的编码,才能最後解析出高质量的
声音和图像。本文介绍了MPEG2标准的压缩分层和编码原理,并说明了如何在芯片上实现
MPEG2音频编码。
MPEG2 是当今最为流行的AV压缩标准,可用于视频、音频和数字信息存储。完整的MPEG2
标准可满足STB等广播应用和DVD或D-VHS等多媒体应用。 MPEG2并非对MPEG2编码器进行标
准化,而是为经过MPEG2编码的位流提供了一种标准化格式,另一方面,它也为MPEG2解码
器提供了一个标准模式。
MPEG2标准的音频部分大致基于MPEG1标准,因此二者兼容性很强。这一点使得现有的
MPEG1设备可对MPEG2信号中兼容MPEG1的部分信号进行解码,而MPEG2设备也可解码MPEG1
信号,从而实现前向兼容。
压缩分层
MPEG2 和MPEG1音频压缩可分为三层。层数越高,压缩的程度、所需CPU处理能力以及声音
质量也相应增加;而传输所需的带宽则相应减少。因此,第一层的压缩率最低、所需CPU
处理能力最低、延迟也最少。由于压缩率最低同时声音质量最差,因此它所需的传输带宽
最大。而第三层的声音质量最佳,压缩率可达1:10。处理时间也几乎是第一层的三倍。表
1可很好地说明这一点。 表1:MPEG2和MPEG1音频压缩可分为三层。
之所以将压缩分为三个层,一部分是基于需要,一部分则是历史原因。
首先,它很大程度取决于所压缩信号将用于哪种应用中。例如,当我们主要希望能再现高
品质的声音,其次才关注处理能力/成本,那麽应选择第三层。而如果主要考虑的是处理
能力和成本,则可选择第一层或第二层。不过,如果选用的不是第三层,则声音在重现时
会有所欠缺,因此,用户必须权衡考虑,选择适合于其特殊应用的那一层。
其次,压缩层的概念是逐渐发展而来的。第三层规范比第一、二层定得晚。当第三层规范
开始流行时,采用第一、二层规范的设备已十分普及,消费者也非常熟悉了。因此,必须
让消费者能自由地选择适合自己应用的那一层规范。
MPEG2音频压缩及编码
三层规范的音频压缩及编码过程如图1所示。滤波器组采用快速傅利叶变换(FFT)将时域采
样转换成同样数目的频域采样。输出是一系列带宽相等的子带。心理声学模式过程计算每
一子带的信号掩蔽比(SMR),以便决定每一子带可用于编码的信号位数。在信号位或噪声
分配过程中,通过滤波器组的输出及SMR信息来决定每个子带可承受的量化噪声。量化噪
声越高,这一子带所分配的信号位数就越低。在位流格式化模块中,子带频率采样与分配
给该层的信号位及一些其它信息相结合,形成一个音频帧,这个帧包括一个信号头和其它
信息段。 图1:三层规范的音频压缩及编码过程。
MPEG2音频增强功能
与MPEG1相比,MPEG2在以下方面有所改善。
1. 半采样率
在MPEG2中,仅需使用MPEG1中一半的采样率便可保持极佳的声音质量。这一点对评论频道
、多语频道及多媒体等应用尤其有益,这些频道的频率范围为20Hz到20kHz,但极少使用
。
2. 多频道扩展
MPEG2 支持5个音频信道,共同实现一种「环绕」立体声效果,以便获得更为逼真的立体
声。这5个信道分别是左信道(L)、右信道(R)、中央信道(C)、左後环绕信道(Ls)和右後环
绕信道(Rs)。这种情况下,在前面布置3个高音音箱,在後面布置2个,因此也可称为3/2
立体声。如图2所示。 图2:MPEG2支持5个音频信道,共同实现一种「环绕」立体声效果
,以便获得更为逼真的立体声。
在芯片上实现MPEG2音频编码
MPEG2 音频编码可以单独或与MPEG2视频编码一起在硬件上实现。在後一种情况下需要增
加多路复用器或多路输出选择器,以进行相应的编码或解码;也可以采用一个编解码器来
完成两个功能。通常MPEG2音频编码是通过DSP来实现的,这种方案成本更低而且更为灵活
。MPEG2音频解码器芯片电路方块图如图3所示。
许多电子设备厂商生产的MP3播放器中都有这一系统,并带有MPEG2音频第三层解码器。一
些MP3播放器可存储约1-2小时的音乐,这种情况下通常存储在记忆棒或闪存中。带有硬盘
的播放器则可存储更多信息。图3:MPEG2音频解码器芯片电路方块图。
如果要同时实现MPEG2音频和视频编码,则两种数据流的多路复用是一个关键问题。可以
在同一块芯片上进行音频和视频信号编码,也可以采用另一块芯片。这一过程由ITU
13818-3标准控制,可选择使用程序流(program stream)或传输流(transport stream)。
在多路复用的情况下,MPEG2音频和视频信号共用带宽。除了音频和视频信号外,数据流
中还携带了有关两种信号的合成信息。这种情况下,总的比特率(也称为系统比特率)是音
频和视频信号比特率以及数据头和字节填充的总和。显然,视频部分占用了大部分带宽。
当系统比特率高时,音频信号的比特率比视频信号或多路复用数据流的比特率低。这种情
况下,由于带宽十分丰富,因此用户可对音频流的各种参数进行设置以获得最佳的声音质
量。然而,如果比特率较低,情况就不太一样。如果音频部分稍稍浪费一些带宽,视频部
分的带宽便会不够用。最後解析出来的视频质量便会严重受损。这种情况下应小心设置
MPEG2 音频参数。如将「音频PES调节」关闭,音频比特率也应该降低到192kbps或甚至
128kbps。这些设置对改善MPEG2信息流解析质量十分有效。
--
※ 发信站: 批踢踢实业坊(ptt.cc)
◆ From: 140.128.194.155