MPEG2标准的压缩分层和编码原理

现在的位置: 首页 > 综合 > 正文

MPEG2标准的压缩分层和编码原理

2013年02月25日 ⁄ 综合 ⁄ 共 2144字 ⁄ 字号小中大 ⁄ 评论关闭

在多媒体信号传输中，只有对音频和视频信号进行有效的编码，才能最后解析出高质量的声音和图像。本文介绍了MPEG2标准的压缩分层和编码原理，并说明了如何在芯片上实现MPEG2音频编码。

MPEG2是当今最为流行的AV压缩标准，可用于视频、音频和数字信息存储。完整的MPEG2标准可满足STB等广播应用和DVD或D-VHS等多媒体应用。MPEG2并非对MPEG2编码器进行标准化，而是为经过MPEG2编码的位流提供了一种标准化格式,另一方面，它也为MPEG2解码器提供了一个标准模式。

MPEG2标准的音频部分大致基于MPEG1标准，因此二者兼容性很强。这一点使得现有的MPEG1设备可对MPEG2信号中兼容MPEG1的部分信号进行解码，而MPEG2设备也可解码MPEG1信号，从而实现前向兼容。

压缩分层

MPEG2和MPEG1音频压缩可分为三层。层数越高，压缩的程度、所需CPU处理能力以及声音质量也相应增加；而传输所需的带宽则相应减少。因此，第一层的压缩率最低、所需CPU处理能力最低、延迟也最少。由于压缩率最低同时声音质量最差，因此它所需的传输带宽最大。而第三层的声音质量最佳，压缩率可达1:10。处理时间也几乎是第一层的三倍。表1可很好地说明这一点。

之所以将压缩分为三个层，一部分是基于需要，一部分则是历史原因。

首先，它很大程度取决于所压缩信号将用于哪种应用中。例如，当我们主要希望能再现高品质的声音，其次才关注处理能力/成本，那么应选择第三层。而如果主要考虑的是处理能力和成本，则可选择第一层或第二层。不过，如果选用的不是第三层，则声音在重现时会有所欠缺，因此，用户必须权衡考虑，选择适合于其特殊应用的那一层。

表1：MPEG2和MPEG1音频压缩可分为三层。

其次，压缩层的概念是逐渐发展而来的。第三层规范比第一、二层定得晚。当第三层规范开始流行时，采用第一、二层规范的设备已十分普及，消费者也非常熟悉了。因此，必须让消费者能自由地选择适合自己应用的那一层规范。

MPEG2音频压缩及编码

三层规范的音频压缩及编码过程如图1所示。滤波器组采用快速傅利叶变换(FFT)将时域采样转换成同样数目的频域采样。输出是一系列带宽相等的子带。心理声学模式过程计算每一子带的信号掩蔽比(SMR)，以便决定每一子带可用于编码的信号位数。在信号位或噪声分配过程中，通过滤波器组的输出及SMR信息来决定每个子带可承受的量化噪声。量化噪声越高，这一子带所分配的信号位数就越低。在位流格式化模块中，子带频率采样与分配给该层的信号位及一些其它信息相结合，形成一个音频帧，这个帧包括一个信号头和其它信息段。

图1：三层规范的音频压缩及编码过程。

MPEG2音频增强功能

与MPEG1相比，MPEG2在以下方面有所改善。

1. 半采样率

在MPEG2中，仅需使用MPEG1中一半的采样率便可保持极佳的声音质量。这一点对评论频道、多语频道及多媒体等应用尤其有益，这些频道的频率范围为20Hz到20kHz，但极少使用。

2. 多频道扩展

MPEG2支持5个音频信道，共同实现一种“环绕”立体声效果，以便获得更为逼真的立体声。这5个信道分别是左信道(L)、右信道(R)、中央信道(C)、左后环绕信道(Ls)和右后环绕信道(Rs)。这种情况下，在前面布置3个高音音箱，在后面布置2个，因此也可称为3/2立体声。如图2所示。

图2：MPEG2支持5个音频信道，共同实现一种“环绕”立体声效果，以便获得更为逼真的立体声。

在芯片上实现MPEG2音频编码

MPEG2音频编码可以单独或与MPEG2视频编码一起在硬件上实现。在后一种情况下需要增加多路复用器或多路输出选择器，以进行相应的编码或解码；也可以采用一个编解码器来完成两个功能。通常MPEG2音频编码是通过DSP来实现的，这种方案成本更低而且更为灵活。MPEG2音频解码器芯片电路方块图如图3所示。

许多电子设备厂商生产的MP3播放器中都有这一系统，并带有MPEG2音频第三层解码器。一些MP3播放器可存储约1-2小时的音乐，这种情况下通常存储在记忆棒或闪存中。带有硬盘的播放器则可存储更多信息。图3：MPEG2音频解码器芯片电路方块图。

如果要同时实现MPEG2音频和视频编码，则两种数据流的多路复用是一个关键问题。可以在同一块芯片上进行音频和视频信号编码，也可以采用另一块芯片。这一过程由ITU 13818-3标准控制，可选择使用程序流(program stream)或传输流(transport stream)。在多路复用的情况下，MPEG2音频和视频信号共用带宽。除了音频和视频信号外，数据流中还携带了有关两种信号的合成信息。这种情况下，总的比特率(也称为系统比特率)是音频和视频信号比特率以及数据头和字节填充的总和。显然，视频部分占用了大部分带宽。当系统比特率高时，音频信号的比特率比视频信号或多路复用数据流的比特率低。这种情况下，由于带宽十分丰富，因此用户可对音频流的各种参数进行设置以获得最佳的声音质量。然而，如果比特率较低，情况就不太一样。如果音频部分稍稍浪费一些带宽，视频部分的带宽便会不够用。最后解析出来的视频质量便会严重受损。这种情况下应小心设置MPEG2音频参数。如将“音频PES调节”关闭，音频比特率也应该降低到192kbps或甚至128kbps。这些设置对改善MPEG2信息流解析质量十分有效。

作者：

Waqar Saleem

应用工程师

技术解决方案组

富士通微电子美国公司