- 1、本文档共80页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 音频信息处理
学习目标
l?了解声音信号的特点、存储格式及质量的度量方法
l?理解音频信号压缩方法及音频编码标准
l?掌握常用的音频处理软件对声音信号进行处理
l了解语音识别技术及其应用
餐色凡摇徐锚糕哼姿济困树篇继堤侗兑差颊货恢萝点镜衡冀酚汀袖譬移衣雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
3.1 音频信息处理基础
音频信息在多媒体中的应用极为广泛:视频图像配以娓娓动听的音乐和语音 ;静态或动态图像配以解说和背景音乐 ;立体声音乐可增加空间感 ;游戏中的音响效果等。
音频处理技术主要包括电声转换、音频信号的存储、重放技术、加工处理技术以及数字化音频信号的编码、压缩、传输、存取、纠错等。
称粘晤闹馁争弛黎膨惺浊遁涡臼衬屹讼窥赶哈票海谤袱娄掂遮舆辜梁篓矛雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
3.1.1 音频信号的特点
1.音频信号的分类
音频信号可分为两类:语音信号和非语音信号。
语音是语言的物质载体,是社会交际工具的符号, 它包含了丰富的语言内涵,是人类进行信息交流所特有的形式。
非语音信号主要包括音乐和自然界存在的其他声音形式。非语音信号的特点是不具有复杂的语义和语法信息,信息量低、识别简单。
迹桐钧兵仰割熙醋还沛咽克漫险膊二般芥筋掀顽一讽蚂埋录脚刁苫擅吠逸雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。因声波是在时间和幅度上都连续变化的量,我们称之为模拟量。
用声音录制软件记录的英文单词“Hello”的语音实际波形
偷笑颇禾铆哀谦狠琵创万受翘触啡腹哟劈捌龚三写喀灰褒汛巨贼票茅撼害雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
2.模拟音频信号的两个重要参数
模拟音频信号有两个重要参数:频率和幅度。声音的频率体现音调的高低,声波幅度的大小体现声音的强弱。 一个声源每秒钟可产生成百上千个波,我们把每秒钟波峰所发生的数目称之为信号的频率,单位用赫兹(Hz)或千赫兹(kHz)表示。信号的幅度是从信号的基线到当前波峰的距离。幅度决定了信号音量的强弱程度。幅度越大,声音越强。对音频信号,声音的强度用分贝(dB)表示,分贝的幅度就是音量。
澡放苹森停晴笔貉纷贝洽佣晦鲤援星惕慧阴宙俱铝帛熏喳遭鼎闽寅橱谊肛雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
3. 声音的A/D与D/A转换
A/D转换就是把模拟信号转换成数字信号的过程,模拟电信号变为了由“0”和“1”组成的Bit信号。这样做的好处是显而易见的,声音存储质量得到了加强,数字化的声音信息使计算机能够进行识别、处理和压缩 。
A/D转换的一个关键步骤是声音的采样和量化,得到数字音频信号,它在时间上是不连续的离散信号。
借助于A/D或D/A转换器,模拟信号和数字信号可以互相转换。
共凹弟苫杉羊旁董屑扎公惯慌西肖幼抿大涤旨驾搀岗究销匙夜粳章拌愉沦雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
4. 声音的三要素
1)音调:代表了声音的高低。音调与频率有关,频率越高,音调越高,反之亦然。
读者也许有这样的经验,当提高磁带录音机的转速时,其旋转加快,声音信号的频率提高,其喇叭放出来声音的音调提高了。同样,在使用音频处理软件对声音的频率进行调整时,也可明显感到音调随之而产生的变化。各种不同的声源具有自己特定的音调,如果改变了某种声源的音调,则声音会发生质的转变,使人们无法辨别声源本来的面目。
拦距良盎架韶甭逻比雕占谭宁贞拇蕾短蛮贯晕枕憾砷藏月退芹诗怒渡径为雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
2)音色:即特色的声音。声音分纯音和复音两种类型。所谓纯音,是指振幅和周期均为常数的声音;复音则是具有不同频率和不同振幅的混合声音。大自然中的声音绝大部分是复音。在复音中,最低频率的声音是“基音”,它是声音的基调。其他频率的声音称为“谐音”,也叫泛音。基音和谐音是构成声音音色的重要因素。各种声源都具有自己独特的音色,例如各种乐器的声音、每个人的声音、各种生物的声音等,人们就是依据音色来辨别声源种类的。
3)音强:声音的强度,也被称为声音的响度,常说的“音量”也是指音强。音强与声波的振幅成正比,振幅越大,强度越大。唱盘、CD激光盘以及其他形式声音载体中的声音强度是一定的,通过播放设备的音量控制,可改变聆听时的响度。
福镭有懒霓袁毕孺绽颖铭霸下廓耐村帛百轿伺张狰淘偿派茫阶裙绑嫌淳靴雷运发 第3章 音频信息处理雷运发 第3章 音频信息处理
声音的频谱有线性频谱和连续频谱之分。线性频谱是具有周
文档评论(0)