音频制作与转换——音频编码的三步骤

现在的位置: 首页 > 综合 > 正文

音频制作与转换——音频编码的三步骤

2018年03月22日 ⁄ 综合 ⁄ 共 3476字 ⁄ 字号小中大 ⁄ 评论关闭

音频制作与转换——音频编码的三步骤

在音频制作、转换、播放、传输中，我们常遇到许多专业术语。对于这些术语，非专业人士很难透彻的理解，其实也需要特别精通。本为力图以非专业的语言来描述那些常用的参数。其中包括：采样、采样频率、采样精度、综合采样率、量化、编码、码率、数据速率、比特率、位速率、位、字节数等。

绝对不是权威解释，只是个人理解。

许多人在制作、转换了音频文件后，常常疑惑为什么不能在自己的播放设备上播放，这是因为同样的音频文件，其编码格式及其参数设置千差万别，没有一个设备能全能播放不同格式和参数的音频文件。其中很大程度与本文介绍的内容有关。因此，就本文涉及到的内容，建议如下：

1、要按照你的播放设备能够支持的音频文件的相关参数进行设置。

2、当制作音频文件，或将CD光盘音乐文件转换为其它音频文件时，最好采用标准的音频参数（无损），以便今后可以根据需要转换为各种不同的格式。

3、在音频转换中，超出源音频文件的参数设置进行转换是没有实际价值的。也就是说，任何转换软件都无法将低质量的音频转换为高质量的音频。只能根据需要由高向低转换。巧妇难为无米之炊。同样的道理，一个单通道的音频文件，无需将其转换为双通道，因为其根本没有立体声效果，即便是用双通道播放，两个通道的声音是一样的。反而会增大音频文件。

音频编码的三步骤

音频编码就是通过采样—量化—编码三个主要步骤，将声音变为数据音频文件。音频制作或转换，实际就是对声音信号进行编码。

一、采样

采样的过程就是采集声音信号某点的频率值和能量值。

采样点越多。采得的信息就越丰富，还原后就越接近源声音的质量。

采样的多少主要由采样频率、采样精度这两个参数表示。

（一）采样频率（Hz、kHz）

采样频率一般设置为44.1（44）kHz（标准的音频采样频率）就完全可以满足高质量音频收听的需要。

采样频率以Hz（赫兹）或kHz（千赫兹）为单位，表示每秒钟采样的次数。

著名的奈奎斯特定理（Nyquist Theorem）指出，如果要保存原始信号的所有信息，必须用不小于原始信号2倍的频率进行采样。也就是说，对声波每次振动，必须有2个点的采样。

人耳所能听到的声音频率是20Hz到20 kHz之间，20 kHz以上的音频人耳是听不到的。所以根据人耳的频响特征，常选取其20 kHz频率的2倍多一点的44.1kHz作为标准的采样频率。

采样频率一般为40—50 kHz就能完全满足高质量收听的需要。高于48 kHz的采样频率人耳已无法辨别出来了，所以没有多少实用价值。

常用的采样率有：

11.025 kHz（11 kHz），播放小段声音的最低标准，是CD音质的四分之一。

22.050 kHz（22 kHz），可以达到CD音质的一半，只能达到FM广播的声音品质，目前被大多数网站选用。

44.1 kHz（44 kHz），标准的CD音质，可以达到很好的听觉效果。

48 kHz，可以更加精确一些。主要适用于对声音的录制采样。对抓轨（CD光盘音乐文件转换）或转换软件来说，保持44.1 kHz采样频率才是最佳音质的保证之一。

（二）采样精度（bit）

采样精度一般设置为16位（标准的音频采样精度）就完全可以满足高质量音频收听的需要。

采样光有次数多少是不够的，还必须采得该频率点的能量值（信号强度），其用采样精度（位数）来表示。

采样精度以bit（比特、位）为单位。表示每秒钟采得能量值的精度。

例如：8位代表2的8次方，为256个精度单位，16为代表2的16次方，为64K个精度单位。

采样位数客观地反映了对输入声音信号描述的准确程度。位数越大，采集并记录的精度越高，信息量越大，越接近源声音的质量，即记录越准确，失真越小。

16位的采样精度对于电脑多媒体音频而言已经绰绰有余了。超高的采样位数没有什么实际意义。实际上目前流行的都是16位的，大部分也不提供超高位数的设置选项。有些号称可以达到32位，也不过是需要使用特定的软件对16位进行加速。

（三）综合采样率（bps、kbps）

综合采样率越高，采得的信息就越丰富，还原后就越接近源声音的质量。

综合采样率以bps（比特）、kbps（千比特）位单位，表示每秒钟采样的总比信息量。

综合采样率不仅包含采样频率、采样精度指标，还包含了声道指标。

综合采样率=采样频率╳采样精度╳通道数

例如：标准的音频采样率=16（bit）╳44.1（kHz）╳2（双通道）=1411.2（kbps）

综合采样率都是由采样精度、采样频率、声道数量决定的，一般情况下都无需设置综合采样率。大部分情况下，也不提供这个选项。

二、量化

量化的过程就是将声音模拟信号转换为十进位制数字信号的过程。

采样所得的信号仍然是不连贯（离散）的模拟信号。为了实现以数字码表示采样值，必须采用“四舍五入”的方法把采样值分级“取整“，使采样值由无限多个值变为有限个值。量化后的采样信号就转化为按采样时序排列的一串十进制数字码流，即十进制数字信号。

量化的过程是由编码器按照统一标准进行的，一般无需（也不提供选项）人工设置。

三、编码

把量化的采样信号由十进位制的数字信号转换为二进位制数字记录下来，并进行压缩的过程称为编码。

只有经过编码才是能够存储、传输、还原（解码）的音频数字信号。编码的过程又是有损或无损压缩的过程。在满足一定需要的收听质量的前提下，尽量压缩以减小音频文件和数据量，是人们追求的目标。因为文件和

数据量越大，对存储设备、传输设备、解码设备、播放设备等的要求越高。所以，各种不同的编码格式应运而生。

编码的结果，常用码率（数据速率、比特率、位速率）来表示。

码率（数据速率、比特率、位速率）（bps、kbps、Bps、kBps）

用编码（压缩）后的比特数（位数或字节数）表示音频文件制作每秒钟具有的数据量。同时还表示音频文件解码，播放、传输等需要或可处理的数据量。有时还用于计算音频文件的大小。

在相同的综合采样率的情况下，码率越高，音频质量越接近综合采样的质量。码率越高，音频文件越大。要求解码器、声卡、网络传输等具有更高的处理能力。

从这一点上讲，低质量的综合采样率，采用高码率转换并不能使音频质量超过采样质量。反而会无效地加大音频文件，加大音频文件无效内容。因此，根据综合采样数量确定合理的码率，是一个应该掌握的技术。

为了解决高码率面临的问题，在保持可接受质量损失的前提下，采用不同的压缩技术，降低码率，是人们追求的目标。因为只有降低码率，才能减少存储空间（例如：在光盘上录入更多文件），实现网络流畅传输和在线播放等。

码率一般有两种表示方法：

1、用位数表示。单位是（bps、kbps）。此中方法常用于网络速度，例如：512K，表示每秒钟可传输的位数。

例如：标准的音频采样率=16（bit）╳44.1（kHz）╳2（双通道）=1411.2（kbps），如果用位数表示，就是1411.2K了。

2、用字节数表示。单位是（Bps、kBps）。此是普遍采用的方法。当采用大写B时，这表示的是字节数，不过许多流行的表示方法并不采用大写，这就需要根据其提供的数据来判断了。

字节数=综合采样率／8（因为8个位=1个字节，即1Bps=8bps）

例如：标准的音频码率=16（bit）╳44.1（kHz）╳2（双通道）／8=1411.2（kbps，综合采样率）／8=176.4（kBps），

192K（码率）=16（bit）╳48（kHz）╳2（双通道）／8=1536（kbps，综合采样率）／8=192（kBps），

用位数表示的网络速度，除以8，就是字节数。例如：512K／8=64K。

从计算可知，码率设置等于或略高于综合采样率是一个合理的选择，超高没有实际价值。

许多音频制作、转换软件提供了多种码率选择，其并不是绝对与上述计算公式所得一样的，因为其采用的编码格式的压缩比、压缩方式不同。

一般情况下，码率达到256K已经足够了，目前最高的可达320K。MP3常用的码率为128K。

四、音频文件大小的计算

为什么要计算音频文件的大小。因为常要将音频文件刻录到容量有限的光盘中，有些网站限制上传文件的大小，有些播放设备存储能力有限等，这都需要在音频制作时，事先根据限制来计算制作的音频文件的大小，从而选择不同的码率。

音频文件的大小（字节数）=码率╳秒数。

例如：制作一个长度为5分钟（300秒），码率为128（kBps，字节）的音频，

其文件大小为：128（kBps）╳300（秒）=38400（kBps，字节）=38.4（MBps）。

一张容量为700MB的光盘，最多能存储18个同样大小的音频文件。

【上篇】Linux根目录下有哪些目录，存放的内容是什么？
【下篇】AAC 文件解析及解码流程

作者: borrower

该日志由 borrower 于6年前发表在综合分类下，最后更新于 2018年03月22日.
转载请注明: 音频制作与转换——音频编码的三步骤 | 学步园 +复制链接

抱歉!评论已关闭.

学步园

音频制作与转换——音频编码的三步骤

音频制作与转换——音频编码的三步骤

作者: borrower

书签

最新文章New

本站推荐

返回首页