- 1、本文档共82页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 声音3
南京大学多媒体研究所 第3章 声音(3) 内容 一、全频带数字声音的压缩编码 二、MIDI 一、全频带数字声音的压缩编码 1 听觉系统的感知特性 响度 听觉系统对对响度的感知 人的听觉系统存在一个听觉阈值电平,低于这个电平的声音信号就听不到 听觉域值的大小随声音频率的改变而变化,大多数人的听觉系统对2 kHz~5 kHz之间的声音最敏感。 声音是否能听到取决于声音的频率及强度(是否大于该频率对应的听觉阈值) 每个人的听觉域值也不同。 “听阈-频率” 曲线 音调 对音调的感知 人们对音调(音高)的主观感觉, 单位是“美”(Mel) 主观感觉的音调与频率之间并不是线性关系: Mel=1000*log2(1+f) 人耳对频率的感知范围: 20 Hz ~ 20000 Hz 听觉掩蔽特性 一种频率的声音阻碍听觉系统感受另一种频率的声音的现象称为掩蔽效应。前者称为掩蔽声音(masking tone, masker),后者称为被掩蔽声音(masked tone, maskee)。 掩蔽效应可分成2种: 频域掩蔽 时域掩蔽 频域掩蔽 强纯音会掩蔽频率与其靠近的同时发声的弱纯音,这种特性称为频域掩蔽,也称同时掩蔽(simultaneous masking)。 例如,同时有两种频率的纯音存在,一种是1000 Hz的声音(60dB),另一种是1100 Hz的声音(42dB),在这种情况下,1100 Hz的声音就听不到。 弱纯音离强纯音越近就越容易被掩蔽。 不同纯音的掩蔽效应曲线 ①低频纯音可以有效地掩蔽高频纯音,但高频纯音对低频纯音的掩蔽作用则不明显 ②掩蔽效应的作用范围和大小,与声强及频率有关,频率越高、声音越强,掩蔽效应越大。 时域掩蔽 临界频带 同一个频带里的声音相同 非线性的25个临界频带 临界频带的掩蔽效应 2 MPEG-1 Audio(11172-3) 什么是MPEG-1与MPEG-1 音频 MPEG-1是活动图象及其伴音的压缩编码标准,其中 MPEG-1 Part3 (audio)是音频压缩编码。 诞生于1992年 目的是把221Mbit/s的NTSC图像压缩到1.2Mbit/s,压缩率为200∶1。 传输速率为1.5Mbits/s,每秒播放30帧,具有CD音质 视频约1.2 Mbits/sec, 音频约0.3 Mbits/sec (CD 唱片的码率: 44,100 samples/sec * 16 bits/sample * 2 channels 1.4 Mbits/sec) 典型应用 VCD MPEG-1音频编码的性能(1) 编码器输入: 取样频率:32kHz、44.1kHz或48kHz 量化精度:16位 数字声音信号带宽: 20-20kHz 编码器输出: 码率:32-384 kbps 格式:MPEG-1格式 MPEG-1音频编码的性能(2) (2) 提供三个独立的压缩层次: 压缩倍数 码率 延迟时间 语音质量 1 语音质量 2 1 4:1 384 19ms 2 6-8:1 192-256 35ms 2.1-2.6 4+ 3 10-12:1 112-128 59ms 3.6-3.8 4+ MPEG-1音频编码的性能(3) 支持4种不同的模式: 单通道(Single channel), 双通道(Dual channel,二个独立的声音信号编码在一个比特流中), 立体声(Stereo, 左右声道的信号分别编码在一个流中) 联合立体声(Joint stereo,利用左、右声道信号的相关性,降低输出比特流的码率)。 MPEG-1音频编码的性能(4) 编码后的数据流支持循环冗余校验CRC(cyclic redundancy check)。 支持在数据流中添加其它附加信息。 MPEG-1音频编码的原理 MPEG –1音频是一个子带编码系统,声音数据压缩算法的根据是心理声学模型: 将audio信号分割成32个不同的子频带, 充分利用听觉系统的掩蔽特性(主要是利用频域掩蔽特性), 保留可感知的信号进行编码,而扔掉被掩蔽的信号不进行编码, 计算出以频率为自变量的噪声掩蔽阈值(masking threshold),按照信掩比(SMR)来决定分配给各个子带的量化位数,调节各个不同子带的量化编码。 MPEG-1音频“层1” 编码器 多相滤波器组 量化器的比特分配算法 根据输出码率决定每一帧样本的比特总数A;然后在不超过总数A的前提下,使
您可能关注的文档
- 第11课 “伐无道 诛暴秦”课件.ppt
- 第13讲电子旅游代理商务.ppt
- 第1415章 核酸的物理化学性质.ppt
- 第13课 灿烂的宋元文化一课件.ppt
- 第13单元.ppt
- 第11课 北伐战争课件人教版.ppt
- 第14章讲义 消费者剩余.ppt
- 第08章 微生物的生态5学时.ppt
- 第15课 汉通西域和丝绸之路课件 新课标 人教版.ppt
- 第14课 匈奴的兴起及与汉朝的和战课件5.ppt
- 2025年合肥科技职业学院单招(数学)历年真题考点含答案解析.docx
- 2025年合肥通用职业技术学院单招职业适应性测试历年(2019-2024年)真题考点试卷含答案解析.docx
- 银行金融合同范本9篇.docx
- 2025年吉安职业技术学院单招英语2014-2024历年真题考点试卷摘选含答案解析.docx
- 调味品厂用工劳动合同10篇.docx
- 2025年吉安职业技术学院单招职业适应性测试历年(2019-2024年)真题考点试卷含答案解析.docx
- 2025年吉安职业技术学院单招语文2019-2024历年真题考点试卷含答案解析.docx
- 2025年合肥幼儿师范高等专科学校单招(数学)历年真题考点含答案解析.docx
- 2025年吉林交通职业技术学院单招职业适应性测试历年(2019-2024年)真题考点试卷含答案解析.docx
- 赡养继承协议书样书经典版8篇.docx
最近下载
- 教科版小学科学四年级下册总复习试题(连线题).doc VIP
- 长虹LED42C2000黑屏故障通病维修方法分享.doc
- 教科版(2025秋)四年级科学下册总复习之连线题(含答案) .pdf VIP
- 2025年机修钳工(高级技师)职业技能鉴定理论考试题库资料(含答案).pdf
- 三字经全文带拼音完整版 打印版.pdf VIP
- 科教版小学科学四年级下册期末复习专项训练题04——连线题(含答案+详细解析).docx VIP
- 江苏省苏北四市(徐州、宿迁、淮安、连云港) 2025届高三第一次调研测试思想政治试题(含答案).pdf VIP
- 消防员心理培训课件.pptx VIP
- 2024年高考政治真题汇编《哲学与文化》.docx
- 风力发电场生态保护及恢复技术规范-DB21.PDF
文档评论(0)