- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章音频处理(周莉)
音频处理
音频信号是人类获取外界信息的重要途径之一,也是多媒体素材处理的基本内容之一。声音信号携带着大量有用的信息,它也可以增强对其他类型媒体表达的信息的理解。现在的计算机都配备了声卡,能够对声音进行录制、编辑、合成。使用计算机对音频素材进行采集、编辑处理,使其产生更加丰富、完美的声音效果,再运用到多媒体作品中,能使多媒体作品具有更强的表现力。
1.1 数字音频技术基础知识
1.1.1 声音的基本概念
声音是人类感知自然的重要媒介,人类的听觉和视觉起到认识自然的重要作用。在多媒体产品中,声音是必不可少的对象,其主要表现形式是语音、自然声和音乐。通过对声音的运用,使人们更加形象、直观、容易地认识事物所表现的内容。在多媒体应用系统、多媒体广告、数字媒体等领域,声音的作用显得尤为重要。
音频(Audio)是人们用来传递信息最方便、最熟悉的方式,是多媒体系统使用最多的信息载体。多媒体技术的发展,使计算机处理音频信息达到比较成熟的阶段。音频信号可以携带大量精确的信息。
音频是通过一定介质(如空气、水等)传播的一种连续波,在物理学中称为声波。声音的强弱体现在声波压力的大小上(和振幅相关),音调的高低体现在声波的频率上(和周期相关),如图所示。
1、振幅
声波的振幅就是通常所说的音量。在声学中用来定量研究空气受到的压力大小。
2、周期
声音信号以规则的时间间隔重复出现,这个时间间隔称为声音信号的周期,用秒来表示。
3、频率
声音信号的频率是指信号每秒变化的次数,用赫兹(Hz)表示。人们把频率小于20Hz的信号称为亚音信号或次声波信号;频率范围为20Hz~20KHz的信号称为音频(Audio)信号(人耳可以接收的声音信号范围);高于20KHz的信号称为超音信号,或称为超声波信号,另外,人所发出的声音信号频率范围大致在200Hz到3400Hz之间,因此把这一范围的声音信号称为话音信号。在多媒体技术中,处理的声音信号主要是音频信号,它包括音乐、语音等。
4、带宽
带宽是指频率覆盖的范围。此术语同样应用于计算机网络中,它表示在一条通信线路上可以传输的载波频率范围。它是网络中十分重要的因素,因为一条信道的传输能力和它的带宽有直接的联系。对声音信号的分析表明,声音信号由许多频率不同的信号组成。多种频率信号称为复合信号,单一频率信号称为分量信号。声音信号的带宽用来描述组成复合信号的频率范围,如高保真声音的频率范围为10Hz~20KHz,它的带宽约为20KHz。
声音有三要素,分别是响度、音调、音色。
1、响度
响度又称音量,表示声音能量的强弱程度,大小主要取决于声音接收处的声波振幅,单位是分贝(dB)。人耳感受到的声音强弱,是人对声音大小的一个主观感觉量。就同一声源来说,波幅传播得愈远,响度愈小;当传播距离一定时,声源振幅愈大,响度愈大。当声音的频率、声波的波形改变时,人对响度大小的感觉也将发生变化。
2、音调
声音的高低称为音调,表示人耳对声音调子高低的主观感受。音调的高低主要取决于声波频率的高低,单位是赫兹(Hz),频率高则音调高,频率低则音调低。通常自然界和乐器发出的声波都是复音,波形复杂,所以音调的高低,实际由很多因素所决定。
3、音色
音色又称音品,表示声音的品质,音色由声音波形的谐波频谱和包络决定。声音是由空气分子振动而产生的,是一个随时间变化的连续信号。做简谐振动的发声体发出的声音是纯音,也称单音。纯音一般只能由专用设备产生。波形可以近似地看成一种周期函数的图形。自然界的声音、乐器发出的声音一般是由若干个频率和振幅都不同的纯音所组成的复音。复音中频率最低的纯音称为基音,它是决定音调的基本要素。复音中存在的其他频率的纯音是复音中的次要成分,称为谐音。基音和谐音合成复音,决定了特定的声音音质和音色。复音中包括基音和泛音。基音的频率最低,由发音体全段振动产生,泛音由发音体各部分振动产生。每个复音都包括固有音调的基音以及不同频率和响度的泛音,通过不同的泛音可以区别其他具有相同基音的复音,形成独特的音色。例如合奏的二胡、月琴、琵琶,虽然产生的基音的音调和响度基本相同,但由于泛音的音调和响度不同,也就是音色不同,给人们的听觉感受完全不同。
1.1.2 常用的数字音频文件格式
数字音频文件格式有很多种,常用的有WAV、MIDI、CDA、MP3、RM、WMA等。下面分别介绍它们的特点和用途。
1.WAV格式
WAV格式是微软公司开发的一种声音文件格式,它符合RIFF(Resource Interchange File Format)文件规范,用于保存Windows平台的音频信息,是目前计算机最为流行的声音文件格式。Windows以及几乎所有的音频编辑软件、多媒体制作软件都支持WAV格式。WAV格式记录实际声音采样数据,可以重现各种声音。标准格式的WA
您可能关注的文档
最近下载
- 人教版初中生物会考试卷及答案.pdf VIP
- 2023年海南师范大学软件工程专业《数据结构与算法》科目期末试卷B(有答案).docx VIP
- 2023年四川省广元市中考地理试题卷(含答案详解).docx
- 2023年海南师范大学软件工程专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
- 广西师范大学2020-2021学年《认知心理学》期末考试试卷(B卷)含参考答案.docx
- 羊常见疾病防治.ppt VIP
- 国开期末考试3987《Web开发基础》机考试题及答案(李老师第5套).pdf VIP
- 2024年怀化市靖州苗族侗族自治县六年级下学期小升初真题精选语文试卷含答案.doc VIP
- 2023年海南师范大学软件工程专业《计算机网络》科目期末试卷B(有答案).docx VIP
- 2025年社区工作者招聘考试题库及答案解析.docx VIP
文档评论(0)