现在的位置: 首页 > 综合 > 正文

画出wav文件声音数据的波形曲线

2013年09月05日 ⁄ 综合 ⁄ 共 4240字 ⁄ 字号 评论关闭
by Touzani

        WAV文件格式

波形音频文件(*.WAV)是Microsoft为Windows设计的多媒体文件格式RIFF(The Resource Interchange File Format,资源交换文件格式)中的一种(另一种常用的为AVI)。RIFF由文件头、数据类型标识及若干块(chunk)组成。
 
WAV文件的基本格式
内容
变量名
大小
取值
RIFF
文件标识符串
fileId
4B
“RIFF”
头后文件长度
fileLen
4B
非负整数(=文件长度-8)
数据类型标识符
波形文件标识符
waveId
4B
“WAVE”
格式块
块头
格式块标识符串
chkId
4B

“fmt ”

头后块长度
chkLen
4B
非负整数(= 16或18)
块数据
格式标记
wFormatTag
2B
非负短整数(PCM=1)
声道数
wChannels
2B
非负短整数(= 1或2)
采样率
dwSampleRate
4B
非负整数(单声道采样数/秒)
平均字节率
dwAvgBytesRate
4B
非负整数(字节数/秒)
数据块对齐
wBlockAlign
2B
非负短整数(不足补零)
采样位数
wBitsPerSample
2B
非负短整数(PCM时才有)
扩展域大小
wExtSize
2B
非负短整数
可选(根据chkLen=16 or 18判断)
扩展域
extraInfo

extSize B

扩展信息
数据块
块头
数据块标识符串
chkId
4B

“data”

头后块长度
chkLen
4B
非负整数
块数据
波形采样数据
x或xl、xr

chkLen B

左右声道样本交叉排列
样本值为整数(整字节存储,不足位补零)
整个数据块按blockAlign对齐
 
注意:

       wFormatTag = 1时为无压缩的PCMPulse Code Modulation, 脉冲编码调制)标准格式(即等间隔采样、线性量化)。

      单字节样本值v为无符号整数(0~255),实际样本值应为v-128;多字节样本值本身就是有符号的,可直接使用。

有些wav文件在data块之前,fmt块之后还有一个fact..

|  ID    |  4 Bytes |   'fact'          |
        ----------------------------------
      | Size  |  4 Bytes |  
数值为4    |
       ----------------------------------
      | data  |  4 Bytes |  ?? ?? ?? ??  | 

因此要根据读到的ID进行判断

参考: http://www.snowcn.net/?action/viewspace/itemid/260.html  wav文件格式分析详解


Wav文件 有数值表示均为低字节表示低位,高字节表示高位。

通过CArchive>>读入, 会自动转化(把高字节的作为高位)

如读入地址为0000000的双字(DWORD)到变量dw :

0000000: 52 49 46 46 

dw会等于0x46464952

 


为了简化RIFF文件中的4字符标识的读写与比较,Windows SDK在多媒体头文件mmsystem.h中定义了类型
FOURCCFour-Character Code四字符代码):

typedef DWORD FOURCC;

及其构造宏(用于将4个字符转换成一个FOURCC数据)

FOURCC mmioFOURCC(CHAR ch0, CHAR ch1, CHAR ch2, CHAR ch3);

其定义为MAKEFOURCC宏:

#define  mmioFOURCC(ch0, ch1, ch2, ch3)  MAKEFOURCC(ch0, ch1, ch2, ch3);

MAKEFOURCC宏定义为:

#define MAKEFOURCC(ch0, ch1, ch2, ch3)  /

    ((DWORD)(BYTE)(ch0) | ((DWORD)(BYTE)(ch1) << 8) |  /

    ((DWORD)(BYTE)(ch2) << 16) | ((DWORD)(BYTE)(ch3) << 24 ));

例如:

#include <mmsystem.h>

#define ID_RIFF    mmioFOURCC('R', 'I', 'F', 'F')

#define ID_WAVE   mmioFOURCC('W', 'A', 'V', 'E')

……

FOURCC id;

……

              ar >> id;

              if (id != ID_RIFF) {

       ……

}

……

l         播放波形声音文件

函数PlaySound可以播放系统声音、声音资源和声音文件,其函数原型为:

BOOL PlaySound(

  LPCSTR pszSound, 

  HMODULE hmod,    

  DWORD fdwSound

);

例如:

PlaySound(“c://sounds//sample.wav”, NULL, SND_ASYNC);

              PlaySound(ar.GetFile()->GetFilePath(), NULL, SND_ASYNC);

 

下面是完整步骤:

新建MFC应用程序, 单文挡(SDI)项目WavePlayer.

为了使包含PlaySound的程序能够编译通过,必须包含多媒体头文件: #include <mmsystem.h>, 而且需要注意头文件包含的次序.. 否则会提示找不到标识符..

并在项目中添加多媒体库:在项目区中任何页中选中顶部的项目名,选“项目/属性”菜单项或按Alt+F7组合键,弹出“[项目名]属性页”对话框,在该其左上角的“配置”栏的下拉式列表中,选择“所有配置”项,在其左边的“配置”目录栏中,选中“配置属性/链接器/输入”项,在右边顶行的“附加依赖项”栏中键入winmm.lib,按“确定”钮关闭对话框。

 

文件过滤

可通过修改资源视图页的“项目名/项目名.rc/String Table/String Table”串表资源中的IDIDR_MAINFRAME(SDI)所对应的串,为应用程序的文件I/O对话框增加文件过滤器。为WavePlayer程序增加*.wav的过滤器:

将原来的串

IDR_MAINFRAME  “WavePlayer/n/nWavePlayer/n/n/nWavePlayer.Document/nWavePlayer.Document”

修改成

“WavePlayer/n/nWavePlayer/nWave Files (*.wav)/n.wav/nWavePlayer.Document/nWavePlayer.Document”

 

 

文档类cpp 添加如下宏

#define ID_RIFF mmioFOURCC('R', 'I', 'F', 'F')

#define ID_WAVE mmioFOURCC('W', 'A', 'V', 'E')

#define ID_data mmioFOURCC('d', 'a', 't', 'a')

#define ID_fmt  mmioFOURCC('f', 'm', 't',  '/x20')

#define ID_fact mmioFOURCC('f', 'a', 'c',  't')

 

 

文档类添加如下变量

public:

    int num;         // 样本数

    LONG* data;      // 样本数据

    LONG *Ldata, *Rdata;     // 双声道数据

    WORD BytesPerSample, wChannel;     // 一个样本的字节数,  声道数

 

Serialize函数添加如下代码:

if (ar.IsStoring())

    
{

        
// TODO: 在此添加存储代码

    }


    
else

    
{

        
// TODO: 在此添加加载代码

        FOURCC id, chkLen,  dw;    
// 无符号双字

        BYTE b;               
// 无符号字节

        WORD w;              
// unsined short  无符号单字长

        WORD fmtTag;           
//格式标记

        WORD wBitsPerSample;   
//样本位数

        FOURCC dwAvgBytesRate;  

        FOURCC Len;          
// 数据块大小,  BYTE

        ar
>>id;

        
if(id!=ID_RIFF)  return;

        ar
>>dw>>id;

        
if(id!=ID_WAVE) return;

        ar
>>id; if(id!=ID_fmt)  return;

        ar
>>chkLen;            // 16或

        ar
>>fmtTag;            // 只处理PCM(Pulse Code Modulation, 脉冲编码调制)情况

        
if(fmtTag!=1)

            
return;

        ar
>>wChannel;           //声道数

        ar
>>dw;                 //采样率

        ar
>>dwAvgBytesRate;     //平均字节率

        ar
>>w;                  //数据块对齐

        ar
>>wBitsPerSample;     //样本位数

        
if(chkLen==18)

        
{

            ar
>>w;               // 扩展域大小

            
for(int i=0; i<w; i++)  // 读走扩展域的内容

                ar
>>b;

        }


        ar
>>id;            // data or fact

        
if(id==ID_fact)

        
{

            ar
>>dw>>dw;        // 读走fact块内容

            ar
>>id;    //      data  ID

        }

抱歉!评论已关闭.