多媒体计算机技术5(免费阅读).pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多媒体计算机技术 第四章 音频信号和声音卡 音频编码基础 音频处理涉及的内容 音频信号压缩技术 音频编码标准 声音卡的组成和工作原理 语音识别技术及应用 音频处理涉及的内容 音频传播媒体特征,也即声波的物理特性。 音频的记录和产生方式,包括模/数、数/模转换;数据压缩和声音合成。 音频数据的编辑处理 音频信号的处理方法大致可分为两类:一种是数字音频方式,另一种是分析-合成的方式 音频编码基础 声音是携带信息的极其重要的媒体,是多媒体技术研究中的一个重要内容。声音的种类繁多,如人的话音、乐器声、动物发出的声音、机器产生的声音以及自然界的声音等。 这些声音有许多共同的特性,也有它们各自的特性。在用计算机处理这些声音时,既要考虑它们的共性,又要利用它们的各自的特性。 我们将研究声音的基础知识,掌握声音数字化的两个最基本的概念;了解基本的音频信号编码技术。 音频编码基础 声音信号的特点 音频信息的分类 音频信号处理的方法 音频文件的存储格式 声音质量的度量 频带宽度 音频信号的频带越宽,所包含的音频信号分量越丰富,音质越好 动态范围 动态范围越大,信号强度的相对变化范围越大,音响效果越好 信噪比 信噪比SNR(Signal to Noise Ratio)是有用信号与噪声之比的简称。?噪音可分为环境噪音和设备噪音。信噪比越大,声音质量越好。 主观度量法 人的感觉机理对声音的度量最有决定意义。感觉上的、主观上的测试是评价声音质量不可缺少的部分。当然,可靠的主观度量值是较难获得的 音频信息的分类 规则音频 规则音频是一种连续变化的模拟信号,可用一条连续的曲线来表示,称为声波。模拟信号的曲线无论多复杂,在任一时刻t0都可分解成一系列正弦波的线性叠加: 声音信号的特点 声音是通过空气传播的一种连续的波,这种连续性表现在两个方面,一个是时间上的连续性,另一方面是指它在幅度上是连续的。 声音信号的特点 人的听觉器官能感知的频率范围为20~20000Hz ,能感知的声音幅度范围在0~120dB之间,而人的发音器官能够发出的声音频率范围为80~3,400Hz。 声音是一种弹性波,声音信号可以分成周期信号与非周期信号两类。 声音的质量与声音的频率范围有关。 基频与音调 频率是指信号每秒钟变化的次数。人对声音频率的感觉表现为音调的高低,在音乐中称为音高。音调正是由频率ω所决定的。音乐中音阶的划分是在频率的对数坐标(20×log)上取等分而得的: 谐波与音色 nωO称为ωO的高次谐波分量,也称为泛音。音色是由混入基音的泛音所决定的,高次谐波越丰富,音色就越有明亮感和穿透力。不同的谐波具有不同的幅值An 和相位偏移ψn ,由此产生各种音色效果。 幅度与音强 人耳对于声音细节的分辨只有在强度适中时才最灵敏。人的听觉响应与强度成对数关系。一般的人只能察觉出3 分贝的音强变化,再细分则没有太多意义。我们常用音量来描述音强,以分贝(dB=20log)为单位。在处理音频信号时,绝对强度可以放大,但其相对强度更有意义,一般用动态范围定义: 动态范围=20×log(信号的最大强度/信号的最小强度)(dB) 音宽与频带 频带宽度或称为带宽,它是描述组成复合信号的频率范围 音频信号处理的方法 首先对声音进行在时间轴和幅度两个方面进行离散化。 音频文件的存储格式 目前比较流行的主要包括以下几种: 主要用在PC上的以.wav(waveform) 为扩展名的文件格式; 主要用在Unix工作站上的以.au(audio)为扩展名的文件格式; 主要用在苹果机和美国视算科技有限公司的工作站上的以.aiff和snd为扩展名的文件格式 PC机上比较流行的以.rm和.mp3 波形文件格式 .wav为扩展名的文件格式称为波形文件格式 由IBM和微软公司于1991年8月联合开发的 部分音频文件的后缀 声音质量的度量 声音的质量可以用声音信号的带宽和动态范围来衡量,等级由高到低依次是DAT,CD,FM,AM和数字电话。 声音质量的度量还有两种基本的方法:一种是客观质量度量,另一种是主观质量度量。 声音客观质量的度量主要用信噪比SNR (signal to niose ratio)。 主观质量度量最常用的方法有平均意见得分(mean opinion score,MOS)。 音频信号压缩技术 概述 脉冲编码调制 增量调制 自适应脉冲编码调制 差分脉冲编码调制 自适应差分脉冲编码调制 子带编码 概述 数据压缩的主要依据是人耳朵的听觉特性,使用“心理声学模型”来达到压缩声音数据的目的: 听觉系统中存在一个听觉阈值电平 听觉掩饰特性 脉冲编码调制 脉冲编码调制PCM(Pulse Code Modulation)是一种模数转换的最

文档评论(0)

didala + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档