多媒体技术及应用-第4章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四部分 声音和音频信号处理 1. 什么是声音? 声音的种类 声音的种类繁多。人声马嘶、兽鸣鸟叫、风雨雷电、机器轰鸣、悠扬琴声等…… 因此,声音根据内容可以分为:天籁之音,语音,乐音等;根据频率可分为:高音、低音、重低音、超声波与次声波等;根据特性分为乐声和噪声。 声音的实质 从信息处理的角度来看,声音实质上是一种信号,称之为音频信号。 5. 声音质量的度量 声品质可定义为听觉事件对个人各方面需求的满足程度,影响声品质的因素包括物理(声场)、心理声学(听觉感知)、心理(听觉评价)等几方面。 人类的听觉频率范围:20~20KHz。 语音质量等级: 根据声音频带,声音质量分5个等级,依次为:电话、调幅广播(AM)、调频广播(FM)、CD光盘、数字录音带( DAT,Digital Audio Tape) 人的听觉声强范围 7.人类的听觉特性 听觉的掩蔽效应 模拟信号的数字化处理 音频数据压缩处理 1. 音频压缩的理论基础是人的听觉特性。 2. 音频压缩算法的分类: 1) 有损压缩和无损压缩 2) 时域压缩,子带压缩和变换压缩 三种语音编码器: 波形编码器 音源编码器(声码器) 混合编码器 3. 最基本的音频压缩处理方法-PCM编码 脉冲编码调制的概念是1937年,由法国工程师Alec Reeres 最早出来的。1946年美国Bell实验室实现了第一台PCM数字电话终端机。 1962年,晶体管PCM终端机大量应用于市话网中局间 中继线,使市话电缆传输电话路数扩大24~30倍。 70年代后期,超大规模集成电路的PCM编、解码器的出现,使光纤通信、数字微波通信、卫星通信获得了更广泛的应用。 此外,CD唱机和DAT录音机,均采用线性PCM编码来存储音乐信号,为非压缩方式。 PCM算法是最简单、最完善、最常见也是压缩效率最低的编码方法。它用一组二进制数码来代替连续信号的抽样值,具有极强的抗干扰能力。 步骤: 仅对输入信号进行采样-量化-编码。 量化噪声(误差) 两种常见PCM体制: 1)μ律压扩算法 2) A律压扩算法 * * 公共选修课 ● 全程课堂讲授约27~30学时 ●考试: 开卷笔试 ● 讨论3~6学时, 穿插于理论讲授中 广州中医药大学信息技术学院 ● 授课老师:信息学院 陈浩 副教授 创点教程网 2.声音信号的特点 声波具有时间和幅度上的连续性; 声音的传播具有反射、折射、衍射等形式;(声速和多普勒效应) 振幅A 反映了信号的强度;就是声音的大小。 频率F 反映了音调的高低;也即尖细或是低粗。 3.声波的应用 声纳,B超。 4.声音的三要素 音调:指声音的基音频率;(音阶的划分) 音色:指声音的泛音频率;(音频带宽) 音强:指声音的声音幅度;(音量的计量-分贝dB)。 6.音强和响度,听阈和痛阈 音强又称为响度,是表示人的听觉主观判断声音的强弱程度。在心理学上,响度是人耳对音量大小、声音强弱的主观感受。响度大,声音显得丰满;响度小,声音便非常单薄脆弱。在物理上,响度用声压或声强来描述声音的强弱。 响度级为以1000Hz为基准。定义1000Hz、40dB纯音时,响度为1宋。 当声音弱到人耳刚刚能听到的时候,此时的音强称之为:听阈。 当音强达到人耳感觉疼痛的时候,此时的音强称为痛阈。听阈和痛阈是随频率变化的。 人耳的听觉音强范围为0-120dB。 1) 人耳只能察觉出3dB以上音强变化 2) 人耳对不同频段的声音敏感度不同 人耳对1~3KHZ的声音最为灵敏 3) 人的听觉具有掩蔽效应 问题: 音频信号有什么特点? 如何用计算机处理音频信号? 如何获得高质量的音频信号? 模拟到数字的转换-A/D转换(Analog to Digital Conversion) 模拟信号数字化的步骤 : 1.采样 在连续信号中每隔一定时间取一个值; 2.量化 把其大小取整为n位二进制数所能表示的数; 例如: n=4, 即有24=16个级别可用于表示一个采样, 量化后只能以0,1,2……15这16个数之一来表示 3.编码 按一定的规律产生二进制位数据。 模拟信号数字化的原理 —— 将检测到的电压值转换成数字信息 模拟信号的数字化-4bit 采样定理 采样频率要高于被采样信号最高频率的两倍,信号才可能完全复原。 话音最高频率为4000Hz,则需每秒采样8000次;声音的最高频率为20kHz,所以

文档评论(0)

xiaofei2001129 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档