音频信息处理技术.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 音频信息处理技术 3.1 基本概念 由于人们在接收外界信息以及与他人进行交流的过程中,大约有20%是通过听觉实现的,所以音频(声音)是多媒体计算机技术中一种不可缺少的媒体。也正是由于多媒体计算机具有处理音频媒体的能力,才使得计算机走出无声的世界,向人性化迈进了一步。 声音是由物体振动引发的一种物理现象。例如,讲话时声带的振动、小提琴弦的振动、扬声器纸盆的振动都会造成空气的振动,这种振动会不断地向四周传播,当被人耳接收时,我们就听到了声音。 声音媒体分为三类 语音:人的说话声不仅是一种波形, 而且还通过语气、语速、语调携带着比文本更加丰富的信息。这些信息往往可以通过特殊的软件进行抽取。 波形声音:实际上已经包含了所有声音形式,这是因为计算机可以将任何声音信号通过采样、量化数字化,在必要的时候,还可以准确地将其恢复。 音乐:音乐是一种符号化了的声音,这种符号就是乐谱,乐谱则是转变为符号媒体形式的声音。 声音的量纲 声音的振动是一种正弦波,声音的变化必须确定三件事:频率(变化的速度)、幅度(产生的压力)、相位(何时开始)。 另外一方面,人们可以感觉到声音的强弱,可以感觉到歌唱家音调的高低。 因此,声音的量纲分为声音的物理量纲和心理量纲。 声音的物理特性 频率 声压 声强 动态范围 频谱 声音的心理学特征 音调 响度 音色 掩蔽效应 方位感 立体感 声音媒体具有三个要素 音调:与声音的频率有关,频率越快,音调就越高。 音强:又称为响度,它取决于声音的振幅。振幅越大,声音就越响亮。 音色:音色是由于波形和泛音的不同所带来的一个声音属性。 《纯音》一般的声音由几种振动频率的波组成,若该声音只有一种振动频率就叫做纯音; 《复音》由许多纯音组成,复音的频率用组成这个复音的基音频率表示,一般的乐音都是复音; 《基音》是复音中频率最低部分的声音; 《泛音》在一个复音中,除去基音外,所有其余的纯音都是泛音。 物理量纲可以用精确的值来描述,但对某一具体声音得来的心理印象却不容易说明白,因为心理印象要由被测者的经验而定。 声音的心理属性和物理属性不可等同,首先,这些关系不是线性的;其次这些关系不是孤立的;第三,这些关系不是不变的。 两者之间确有关系:例如声音的响度取决于强度和频率两个因素,如果频率不变,强声显得比弱声要响些。但如果强度不变,过高频率的声音和过低频率的声音似乎比中频的声音听起来都要弱一些。由此可见,响度依赖于频率,原因是人耳能反应的频率范围是有上限和下限的。 声音的量纲 听觉特性 等响曲线 由于响度与频率和强度有关,所以在不同频率上的强度是不同的。先设一个音为标准音,给予固定的频率、强度和持续时间,例如1000Hz、40分贝、持续0.5秒;再给一个音也持续0.5秒,但频率不同,通过调整使其响度听起来一样,得到的这样一组曲线称之为等响曲线。等响曲线描述的是响度与频率和强度的关系。从声音心理学考虑,对同一响度的声音在频率上和强度上可以有很大的差别,这对声音表现有重要意义。 掩蔽(masking) 声音的响度不仅取决于自身的强度和频率,而且也依赖于同时出现的其它声音。各种声音可以互相掩蔽,也就是说一种声音的出现可能使得另一种声音难于听清。由于声音的掩蔽效果,可以欺骗人的听觉。例如,本来是多种频率的声音的复合,但听众以为是另一种声音。所以,声音的掩蔽特性常常用于声音的压缩。 临界频带 在频率的某一临界区里,各种声音是相互作用的,合成声音的响度由这些频率共同决定。如果超出临界区,声音的响度不再相互作用,声音的响度随频率的改变而改变。这个临界区就是临界频带,其宽度视其中心频率而定。对于临界频带的确定,使得对声音响度的处理能够有的放矢。 相位 从声音的波形来看,声音的起点和方向也要反映声音的特性,这就是声音的相位。当两个声音相同相位完全相反时,它们将相互抵消;当两个声音相同而且相位也相同时,声音就会得到加强。 相位的确定对于多声道声音系统的设计非常重要,其可以应用在回声的消除、会议系统的声音设计上。 自然声音的时变现象 声音的音调分成三个区域:起始区、稳定状态区、延迟区。 研究表明,音调的频谱分量随时间改变。在稳定状态区,频谱保持固定。在起始区,振幅频谱随时间变化。因此自然声音的起始部分是非常难识别的。例如刚听了一

文档评论(0)

神话 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5203223011000000

1亿VIP精品文档

相关文档