第五章 多媒体音频及音频处理.docVIP

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五章 多媒体音频及音频处理.doc

第五章 多媒体音频及音频处理 本章提要 ● 声音媒体的有关概念 模拟声音信息的数字化处理 MIDI与音乐合成 数字音频格式及格式转换 音频卡(声卡) 音频处理软件-Cool Edit Pro 2.0 语音识别技术 音频(声音)是表达思想和情感的一种必不可少的媒体,也是多媒体信息中一个重要组成部分。声音的种类有很多,从人的说话声、乐声到风声、雨声,当它能与文字、图像等结合,一起传递信息时,计算机世界才会变得如此丰富多彩。 5.1 音频信息及数字音频的产生 5.1.1 多媒体中的音频信息 自然界中的声音是由于物体的振动产生的,通过空气传递振动,最后这种机械运动被传递到人的耳膜而被人感知。我们下面以音叉为例,具体说明一下声音的产生和传播过程。当一个音叉受到敲击振动时,叉枝会左右摆动。当叉枝向外摆动时,叉枝会挤压周围的空气使周围空气形成一个密部,相反,当叉枝向内摆动时,会引起周围的空气拉动而形成一个疏部。空气这样密部与疏部交替运动形成一种波(声波)会向周围发散传播出去,从而形成声音的传播。传播过程如图5-1所示。 这种声音的传播运动最后传递给人的耳膜并通过听小骨传递给听觉神经产生了人的听觉。听觉是人类感知自然的一种重要手段,所以音频也就成为多媒体范畴中一个重要部分。 从听觉角度讲,声音媒体具有三个要素:音调、音强和音色 (1)音调:与声音的频率有关,频率越快,音调越高。所谓声音的频率是指每秒中声音信号变化的次数,用Hz表示。例如,20Hz表示声音信号在1秒钟内周期性地变化20次。 并不是所有频率发出的声音信号都能够被人们感觉到,人的听觉范围大约为20—20000Hz,这个频率范围内的信号被称为音频或声音,多媒体技术主要研究的是这部分音频信息的使用;频率范围小于20Hz的信号被称为亚音频,这个范围内的信号人们一般感受不到。比如,大气压的变化周期很长,以小时或天数计算,人们几乎感觉不到这种气压信号的变化,更听不到这种变化所带来的声音:频率范围高于20kHz的信号被称为超音频或超声波,超声波具有很强的方向性,并且可以形成波束,利用这种特性,人们制造了超声波探测仪、超声波焊接设备等;另外,人的发声器官可以发出80~3400Hz频率范围的声音,但人们平时说话的频率范围在300~3000Hz之间。了解这些知识很重要,它可以指导我们更有效地处理音频信息。 (2)音强:又称为响度,它取决于声音的振幅。振幅越大,声音就越响亮。 (3)音色:在介绍音色之前,先给出几个有关的概念。 ● 纯音:一般的声音由几种振动频率的波组成,若该声音只有一种振动频率就叫做纯音; ● 复音:由许多纯音组成,复音的频率用组成这个复音的基音频率表示,一般的乐音都是复音; ● 基音:是复音中频率最低部分的声音; ● 泛音:在一个复音中,除去基音外,所有其余的纯音都是泛音。 音色则是由混入基音的泛音所决定的,每个基音又都有其固有的频率和不同音强的泛音,从而使得每个声音具有特殊的音色效果。比如,每个人讲话的声音以及钢琴、提琴、笛子等各种乐器所发出的不同声音,都是由音色不同造成的。 声音的传播是以声波形式进行的。由于人类的耳朵能够判别出声波到达左、右耳的相对时差、声音强度,所以能够判别出声音的来源方向。同时又由于空间作用使声音来回反射,从而造成声音的特殊空间效果。这也正是人们在音乐厅与在广场上聆听音乐感觉效果不一样的原因之一。因此,现在的音响设备都在竭力模拟这种立体声和空间感效果。 声音的质量与声音的频率范围有关,即频率范围越宽,声音的质量就越好。表5-1是几种常见的声音频宽。 表5-1 几种常见的声音频宽 声音类型 频宽 电话语音 200~3400Hz 调幅广播 50~7000Hz 调频广播 20~15000Hz 宽带音响 20~20000Hz 衡量声音质量单凭声音频宽判断有时比较困难,主观打分则是一种比较快捷、简单的方法。它的具体操作过程与近几年在电视节目中流行歌手大奖赛评分方法类似。首先挑选一些有代表性的人物,聆听需要评测的各种声音,每个人根据感觉给出分数,最后的平均分就是相对应的声音效果的评价结果。实际上,不同的应用对象,声音质量的衡量标准也不尽相同。对于语音来说,通常用可懂度、清晰度和自然度来衡量;对于音乐来说,就要求具有一定的保真度、立体感和音响效果。 声音是一种基于时间的媒体。没有时间就没有声音,因此,我们说声音具有过程性,需要有一个时间段才能表现,这也就是我们常用音乐作为伴音的原因,它可以很好地起到渲染气氛的作用。由于时间性,声音数据具有很强的前后相关性,数据量较大,且实时性要求较高。 5.1.2 数字音频的产生 自然界的声音经过麦克风后,机械运动被转化为电信号,这时的电信号由许多正弦波组成,其中正弦波的频率取决于声音中含有的频率。对于计算

文档评论(0)

dzzj200808 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档