- 1、本文档共169页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第4章数字声音编码本章内容音频信号压缩的可能性G.7XX声音压缩编码技术各标准的编码方法;编/解码器等MPEG-X声音压缩编码各标准的编码方法;编/解码器等4.1音频信号压缩的可能性人耳可以听到的声音是频率在20Hz~20kHz之间的声波,称为可听声。音频信息就是指这一类声音,可听声有三类。(1)语音:由口腔发出的声波,频率大致在200Hz~3.4kHz之间,主要用于信息解释说明、叙述、答问,也可以作为命令参数输入语言。(2)音乐声:是由各种乐器产生的,音频范围都可以存在,本身可供欣赏,也可作为烘托气氛,是音频信息的重要组成部分之一。(3)效果声:大自然物理现象产生的,如刮风、下雨、打雷等,还有一些人工产生的,如爆破声、拟音等,对语音和音乐起补充作用。音频信号压缩的可能性对于高质量和长时间的音频数据,由于数据量都特别大,为了有效地存储和传输,需要进行压缩编码。衡量语音编码性能的主要因素有:编码质量;编码速率;算法复杂度。压缩的可能性存在于:1)时域冗余。2)频域冗余。3)听觉冗余。1).时域冗余(1)两种主要的时域冗余:语音信号幅度分布的非均匀性和样本之间的相关性。非均匀性表现为小幅度语音信号出现的概率大而大幅度语音信号出现的概率小?非均匀量化技术,例如ADPCM编码算法;样本之间的相关性表现为样本点之间的短时相关性和相邻基音周期之间的长时相关性,利用语音信号的相关性,可以在实现低速率编码时,也能保持较高的语音编码质量,例如线性预测算法就是利用这一原理。1).时域冗余(2)周期之间的相关性虽然音频信号分布在20Hz~20kHz的频带范围内,但在一定的瞬间,某一声音往往只是该频带内的少数频率成分在起作用。当声音中只存在少数几个频率时,在周期与周期之间,存在着一定的相关性。利用音频信号周期之间信息冗余度的编码器,比只利用邻近样值间的相关性的编码器效果要好,但编码器要复杂得多。1).时域冗余1).时域冗余2)频域冗余3).听觉冗余利用了人耳的听觉特性
人耳对语音信号的听觉特性表现在3个方面:一是人耳对语音信号的分辨率有限;二是人耳对语音信号某些失真不是很敏感;三是人耳的掩蔽效应。低速率高品质语音编码算法的实现就是基于人耳的这些听觉特性,既可以保证人耳感觉不到语音质量的下降,又降低了语音编码速率。2.音频信号压缩编码的分类4.2主流音频编解码标准4)音频编码技术发展的历史语音编码标准发展历史音频编码标准发展历史4.3话音编译码方法与原理波形编译码器(waveformcodecs)音源编译码器(sourcecodecs)混合编译码器(hybridcodecs)。一般来说,波形编译码器的话音质量高,但数据率也很高;音源编译码器的数据率很低,产生的合成话音的音质有待提高;混合编译码器使用音源编译码技术和波形编译码技术,数据率和音质介于它们之间。感知编码感知编码利用心理声学分析原理来实现音频压缩。例如MPEGAudioLayer3采用的算法ASPEC(AdaptiveSpectralPerceptualEntropyCodingofhighqualitymusicalsignal,高质量音乐信号自适应谱感知熵编码),将原始音频信息数据压缩率达到10:1甚至12:1。当然这是一种有损压缩,但是人耳却基本不能分辨出失真来。波形编解码器基本上不考虑信号是如何产生的,而直接将输入的模拟信号抽样编码,然后将量化后的样值传送到终端,在终端原始信号被重组到与原信号大致接近的程度。优点是适应能力强、话音质量好、抗噪抗误码的能力强等特点,缺点是同其他的编解码器相比,要使用大量的带宽,当波形编解码器用于低带宽时,话音质量下降得非常快。
脉冲编码调制(PCM)、自适应增量调制(ADM或ΔM编码)、自适应差分编码(ADPCM)、自适应预测编码(APC)、自适应子带编码(ASBC)、自适应变换编码(ATC)等都属于波形编码。脉冲编码调制(PCM)脉冲编码调制(PCM)的概念PCM是pulsecodemodulation的缩写概念上最简单、理论上最完善、最早研制成功、使用最为广泛、数据量最大的编码系统脉冲编码调
您可能关注的文档
- 腰椎间盘突出症小讲课.pptx
- 胃痛中医课件.pptx
- 职业卫生管理制度(包括防尘、防毒管理).docx
- 老年心理状况评定表(含评分).docx
- 综合应急预案演练方案.docx
- 继电保护完整版本.ppt
- 统编版三下语文教材解读及教学建议.pptx
- 细胞增殖-一轮复习-课件.ppt
- 纺织专业英文术语.docx
- 纯电动汽车高压电气架构简介.pptx
- 2024高考物理一轮复习规范演练7共点力的平衡含解析新人教版.doc
- 高中语文第5课苏轼词两首学案3新人教版必修4.doc
- 2024_2025学年高中英语课时分层作业9Unit3LifeinthefutureSectionⅢⅣ含解析新人教版必修5.doc
- 2024_2025学年新教材高中英语模块素养检测含解析译林版必修第一册.doc
- 2024_2025学年新教材高中英语单元综合检测5含解析外研版选择性必修第一册.doc
- 2024高考政治一轮复习第1单元生活与消费第三课多彩的消费练习含解析新人教版必修1.doc
- 2024_2025学年新教材高中英语WELCOMEUNITSectionⅡReadingandThi.doc
- 2024_2025学年高中历史专题九当今世界政治格局的多极化趋势测评含解析人民版必修1.docx
- 2024高考生物一轮复习第9单元生物与环境第29讲生态系统的结构和功能教案.docx
- 2024_2025学年新教材高中英语UNIT5LANGUAGESAROUNDTHEWORLDSect.doc
最近下载
- 2023-2024学年七年级上册语文期末专项热点必刷100题专题11记叙文阅读(含答案).docx VIP
- 《隧道施工质量监理要点》.docx VIP
- 《Java语言程序设计基础教程》习题解答26752指导.doc
- 医务管理系统建设方案.doc VIP
- 小学英语二年级上册英语课件-UNIT FOUR THERE ARE MANY ANIMALS lesson 15 北京版.pptx VIP
- 苏教版数学五年级上册小数除以小数(课件).pptx
- 病房(医嘱)管理系统.doc
- 学前儿童急症救助与突发事件应对 22 模块四任务4 火灾的应急处理与预防.pptx VIP
- 光伏项目高处坠落的风险点及控制措施(A).pptx VIP
- 急性脊髓炎的护理ppt课件.pptx
文档评论(0)