wav音频格式.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
wav音频格式

电话录音采用什么文件格式? 小灵呼电话录音系统LV包括呼叫中心系统的录音功能均采用WAV格式作为文件存储,其实WAV格式也分2、4倍压缩率及线性无压缩之分,参见电话录音压缩率说明,我们可以看到a率、u率、adpcm、8位pcm,16位pcm均可采用WAV格式存储,可见采用WAV格式存储并不一定很占空间,它还是可以采用压缩格式的。 电话录音采用WAV有什么好处? WAV是Windows世界里最通用最流行的语音压缩存储格式,采用此格式存放录音文件,可以被大多数播放软件播放,而不局限于通过小灵呼软件界面播放。 WAV文件格式介绍 文件是Windows标准的文件格式,WAV文件作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange FileFormat的缩写,每个WAV文件的头四个字节便是“RIFF”。WAV文件由文件头和数据体两大部分组成。其中文件头又分为RIFF/WAV文件标识段和声音数据格式说明段两部分。WAV文件各部分内容及格式见附表。常见的声音文件主要有两种,分别对应于单声道(11.025KHz采样率、8Bit的采样值)和双声道(44.1KHz采样率、16Bit的采样值)。采样率是指:声音信号在“模→数”转换过程中单位时间内采样的次数。采样值是指每一次采样周期内声音模拟信号的积分值。对于单声道声音文件,采样数据为八位的短整数(short int 00H-FFH); 而对于双声道立体声声音文件,每次采样数据为一个16位的整数(int),高八位和低八位分别代表左右两个声道。WAV文件数据块包含以脉冲编码调制(PCM)格式表示的样本。WAV文件是由样本组织而成的。在单声道WAV文件中,声道0代表左声道,声道1代表右声道。在多声道WAV文件中,样本是交替出现的。 WAV文件格式说明表 文件头 偏移地址 字节数 数据类型 内 容 00 H 4 char RIFF标志 04 H 4 long int 文件长度 08 H 4 char WAV标志 0C H 4 char fmt标志 10 H 4 ? 过渡字节(不定) 14 H 2 int 格式类别(10H为PCM形式的声音数据) 16 H 2 int 单声道为1,双声道为2通道数 18 H 2 int 采样率(每秒样本数),表示每个通道的播放速度 1C H 4 long 波形音频数据传送速率,其值为通道数×每秒数据位数×每样 本的数据位数/8。播放软件利用此值可以估计缓冲区的大小 22 H 2 ? 每样本的数据位数,表示每个声道中各个样本的数据位数。如果有多 个声道,对每个声道而言,样本大小都一样。 24H 4 char 数据标记符"data" 28H 4 long int 语音数据的长度 PCM数据的存放方式: 样本1? 样本2 8位单声道 0声道 0声道 8位立体声 0声道(左) 1声道(右) 0声道(左) 1声道(右) 16位单声道 0声道低字节 0声道高字节 0声道低字节 0声道高字节 16位立体声 0声道(左)低字节 0声道(左)高字节 1声道(右)低字节 1声道(右)高字节 PCM数据的存放方式: WAV文件的每个样本值包含在一个整数i中,i的长度为容纳指定样本长度所需 的最小字节数。首先存储低有效字节,表示样本幅度的位放在i的高有效位上, 剩下的位置为0,这样8位和16位的PCM波形样本的数据格式如下所示。 样本大小 数据格式 最大值 最小值 8位PCM unsigned int 225 0 16位PCM int 327 67 多媒体技术近年来发展很快,较好品质的声卡可以提供16位的立体声及44KHZ的播放录制能力,它不仅可以提供原音逼真的取样,其合成的音质也十分理想,有的声卡还加入了数字信号处理器,可编程控制的DSP具有强大的运算能力,它可以用来作声音信息的压缩和一些特殊效果的处理。具有此功能的声卡提供的WAV文件提供的语音信息可以满足语音特征识别的要求。 在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为资源互换文件格式(Resources lnterchange File Format),简称RIFF。例如声音的WAV文件、视频的AV1文件等等均是由此结构衍生出来的。RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由辨别码、数据大小及数据所组成。 块的标志符(4BYTES) 数据大小 (4BYTES) 数据 ?????????????????????????????? 图一、 块的结构示意图 辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本

文档评论(0)

80219pm + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档