多媒体技术及应用-第4章.pptVIP

下载本文档

0
0
约2.4千字
约 38页
2017-08-17 发布于北京
举报
版权申诉

多媒体技术及应用-第4章.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

第四部分声音和音频信号处理 1. 什么是声音? 声音的种类声音的种类繁多。人声马嘶、兽鸣鸟叫、风雨雷电、机器轰鸣、悠扬琴声等…… 因此，声音根据内容可以分为：天籁之音，语音，乐音等；根据频率可分为：高音、低音、重低音、超声波与次声波等；根据特性分为乐声和噪声。声音的实质从信息处理的角度来看，声音实质上是一种信号，称之为音频信号。 5. 声音质量的度量声品质可定义为听觉事件对个人各方面需求的满足程度，影响声品质的因素包括物理(声场)、心理声学(听觉感知)、心理(听觉评价)等几方面。人类的听觉频率范围：20～20KHz。语音质量等级：根据声音频带，声音质量分5个等级，依次为：电话、调幅广播(AM)、调频广播(FM)、CD光盘、数字录音带( DAT，Digital Audio Tape) 人的听觉声强范围 7.人类的听觉特性听觉的掩蔽效应模拟信号的数字化处理音频数据压缩处理 1. 音频压缩的理论基础是人的听觉特性。 2. 音频压缩算法的分类： 1) 有损压缩和无损压缩 2) 时域压缩，子带压缩和变换压缩三种语音编码器：波形编码器音源编码器(声码器) 混合编码器 3. 最基本的音频压缩处理方法－PCM编码脉冲编码调制的概念是1937年，由法国工程师Alec Reeres 最早出来的。1946年美国Bell实验室实现了第一台PCM数字电话终端机。 1962年，晶体管PCM终端机大量应用于市话网中局间中继线，使市话电缆传输电话路数扩大24～30倍。 70年代后期，超大规模集成电路的PCM编、解码器的出现，使光纤通信、数字微波通信、卫星通信获得了更广泛的应用。此外，CD唱机和DAT录音机，均采用线性PCM编码来存储音乐信号，为非压缩方式。 PCM算法是最简单、最完善、最常见也是压缩效率最低的编码方法。它用一组二进制数码来代替连续信号的抽样值，具有极强的抗干扰能力。步骤：仅对输入信号进行采样－量化－编码。量化噪声（误差）两种常见PCM体制： 1)μ律压扩算法 2) A律压扩算法 * * 公共选修课 ● 全程课堂讲授约27～30学时 ●考试: 开卷笔试 ● 讨论3～6学时, 穿插于理论讲授中广州中医药大学信息技术学院 ● 授课老师：信息学院陈浩副教授创点教程网 2.声音信号的特点声波具有时间和幅度上的连续性；声音的传播具有反射、折射、衍射等形式；（声速和多普勒效应）振幅A 反映了信号的强度；就是声音的大小。频率F 反映了音调的高低；也即尖细或是低粗。 3.声波的应用声纳，B超。 4.声音的三要素音调：指声音的基音频率；（音阶的划分）音色：指声音的泛音频率；（音频带宽）音强：指声音的声音幅度；（音量的计量－分贝dB)。 6.音强和响度，听阈和痛阈音强又称为响度，是表示人的听觉主观判断声音的强弱程度。在心理学上，响度是人耳对音量大小、声音强弱的主观感受。响度大，声音显得丰满；响度小，声音便非常单薄脆弱。在物理上，响度用声压或声强来描述声音的强弱。响度级为以1000Hz为基准。定义1000Hz、40dB纯音时，响度为1宋。当声音弱到人耳刚刚能听到的时候，此时的音强称之为：听阈。当音强达到人耳感觉疼痛的时候，此时的音强称为痛阈。听阈和痛阈是随频率变化的。人耳的听觉音强范围为0-120dB。 1) 人耳只能察觉出3dB以上音强变化 2) 人耳对不同频段的声音敏感度不同人耳对1~3KHZ的声音最为灵敏 3) 人的听觉具有掩蔽效应问题：音频信号有什么特点？如何用计算机处理音频信号？如何获得高质量的音频信号？模拟到数字的转换－A/D转换（Analog to Digital Conversion）模拟信号数字化的步骤： 1.采样在连续信号中每隔一定时间取一个值； 2.量化把其大小取整为n位二进制数所能表示的数；例如: n=4，即有24=16个级别可用于表示一个采样，量化后只能以0，1，2……15这16个数之一来表示 3.编码按一定的规律产生二进制位数据。模拟信号数字化的原理 —— 将检测到的电压值转换成数字信息模拟信号的数字化－4bit 采样定理采样频率要高于被采样信号最高频率的两倍，信号才可能完全复原。话音最高频率为4000Hz，则需每秒采样8000次；声音的最高频率为20kHz，所以