[工学]音频信息处理.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[工学]音频信息处理

音频信息处理 本章的主要内容 (1)声音概述(特点、分类) (2)声音的采样和量化 (3)声音文件的格式 (4)语音压缩编码基础 (5)语音合成和语音识别技术技术 声音概述(1) 什么是声音? 声音是通过空气传播的一种连续的波。 声波压力的大小体现声音的强弱 声音的频率体现音调的高低 声音的重要性和特点 信息量大、精细、精确 声音的分类 频率小于20 Hz的信号称为亚音(subsonic); 频率范围为20 Hz~20 kHz的信号称为音频(Audio)高于20 kHz的信号称为超音频(ultrasonic) 声音概述(2) 音频信号的分类:语音信号和非语音信号(风声、雨声、鸟叫声、机器声等,即乐音和杂音),非语音信号的特点是不具有复杂的语义和语法信息,信息量低、识别简单。语音是语言的载体,是人类社会特有的一种信息系统,是社会交际工具的符号。 声音概述(3) 人与人之间、人与机器之间声音信息处理流程图 声音概述(4) 数字音频 将模拟的(连续的)声音波形数字化(离散化),以便利用数字计算机进行处理的过程,主要包括采样和量化两个方面。 数字音频的质量取决于:采样频率和量化位数这两个重要参数。此外,声道的数目、相应的音频设备也是影响音频质量的原因。 声音概述(5) 数字音频可以分为如下几个等级 声音概述(6) 数字音频的存储量 存储量=(采样频率x量化位数)/8(字节数) x 声道数目 如:激光唱盘一分钟音乐需要的存储量为: 44.1X1000Xl6X2X60/8=10,584,000(字节) 声音概述(7) 从人机交互的角度看音频信号处理 (1)人→计算机:包括音频获取;语音识别和理解等; (2)计算机→人:音乐合成、语音合成、立体声模拟等; (3)人→计算机→人:语音采集、音频编码/解码、音频传输、基于内容检索等; 采样和量化(1) 基本概念 1、取样周期:对连续信号取样的时间间隔T 2、取样频率:单位时间内的取样次数1/T 3、奈魁斯特取样定理:要从样值序列完全恢复原始的波形,取样频率必须大于原始有用音频最高频率的2倍 4、量化:对声音信号波形振幅值的离散化 5、量化误差(或量化噪音):量化后的振幅代表值与真实振幅值之间的差; 6、量化跨度:在分割振幅时个个小区间的宽度 采样和量化(2) 采样 采样和量化(3) 量化 采样和量化(4) 量化位数每增加一位,信噪比改善6dB (1)量化位数W、最大振幅A、量化跨度q之间的关系:q = A / 2 w-1 (2)当量化跨度远小于信号振幅时: q = A / 2w (3)量化噪音功率: (4)将信噪比用分贝表示: SNR(dB) = 音频文件的格式 音频文件通常分为两类:声音文件和MIDI文件 (1)声音文件:指的是通过声音录入设备录制的原始声音,直接记录了真实声音的二进制采样数据,通常文件较大; (2)MIDI文件:它是一种音乐演奏指令序列,相当于乐谱,可以利用声音输出设备或与计算机相连的电子乐器进行演奏,由于不包含声音数据,其文件尺寸较小。 声音文件的格式(1)  Wave文件——.WAV (1)Wave格式是Microsoft公司开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范; (2)用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所广泛支持。 (3)Wave格式支持MSADPCM、CCITT ALaw、CCITT μLaw和其他压缩算法,支持多种音频位数、采样频率和声道,是PC机上最为流行的声音文件格式, (4)但其文件尺寸较大,多用于存储简短的声音片断。 声音文件的格式(2) AIFF文件——.AIF/.AIFF (1)AIFF是音频交换文件格式(Audio Interchange File Format)的英文缩写,是苹果计算机公司开发的一种声音文件格式; (2)被Macintosh平台及其应用程序所支持,Netscape Navigator浏览器中的LiveAudio也支持AIFF格式,SGI及其他专业音频软件包也同样支持这种格式。 (3)AIFF支持ACE2、ACE8、MAC3和MAC6压缩,支持16位44.1kHz立体声。 声音文件的格式(3) Audio文件——.AU (1)Audio文件是Sun Microsystems公司推出的一种经过压缩的数字声音格式,是Internet中常用的声音文件格式; (2)Netscape Navigator浏览器中的LiveAudio也支持Audio格式的声音文件。 声音文件的格式(4)

文档评论(0)

hhuiws1482 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5024214302000003

1亿VIP精品文档

相关文档