- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
国家“十一五”规划教材
《数字语音编码》讲议
同济大学电子与信息工程学院
赵晓群 编著
机械工业出版社,2007年
第9章 线性预测声码器
9.1 概述
线性预测声码器是一种参数编码方法。
参数编码利用生成模型,在幅度谱上逼近原语音,
但重建语音的波形与原语音信号的波形较大差别。
参数编码实现语音通信的设备通常称为声码器;
◆例:通道声码器、共振峰声码器、同态声码器、LPC声码器;
本章主要内容:语音压缩的原理与关键技术、
LPC声码器的基本原理、
LPC-10和LPC-10e标准、
混合激励LPC声码器。
9.1.1 语音压缩的基本原理
压缩依据:语音信号的冗余度和人的听觉感知机理。
语音信号中存在多种冗余度,可在时域和/或频域中描述。
1. 时域冗余度
(1) 幅度非均匀分布。
◆语音中,小幅值样本出现的概率高。
(2) 语音信号样本间的相关性很强。
◆语音波形的最大相关性存在于邻近的样本之间。
◆8 kHz 取样时,相邻样本间的相关系数 0.85;
相距 10 个样本,相关系在 0.3 左右。
◆利用这种较强的一维相关性进行预测编码。
(3) 浊语音具有准周期性。
◆浊语音波形是对应于音调间隔周期的长期重复波形。
◆此音调间隔波形可用于预测编码。
(4) 声道的形状及其变化比较缓慢。
◆以较长的时间(如几十秒)进行统计,可得长时自相关函数;
◆长时自相关函数的统计表明,8 kHz 取样的相邻样本间,
平均相关系数高达沟通 0.9。
(5) 静止系数(语音间隙)。
◆统计表明,话音间隙使全双工话路的典型效率约为通话时间的40%(或静止系数为 0.6)。
◆话音间隙本身是一种冗余,可不传或少传静止段信息。
2. 频域冗余度
(1) 非均匀的长时功率谱密度。
◆长时功率谱密度:长时段内功率谱的统计平均,如图9.1(a)。
◆长时功率谱密度呈现强烈的非平坦性。
◆统计观点:未充分利用给定频段,
或者说存在着固定的冗余度。
◆特点:功率谱的高频能量较低,
直流分量并非最大。
(2) 特有的短时功率谱密度。
◆图9.1(b):语音的短时功率谱密度。
◆存在共振峰频率和谷值。
◆前三个共振峰决定语音特征。
◆特点:形成高次谐波结构。
3. 听觉感知机理
(1) 人类听觉系统具有掩蔽效应。
◆在不同声压、不同频率处,声音的掩蔽效应是不同的。
◆用掩蔽特性可抑制与信号共存的量化噪声,降低编码速率。
(2) 人耳对不同频段声音的敏感程度不同。
◆人的听觉对低频端比较敏感,而对高频端不太敏感。
即强的低频音能妨碍同时存在的高频音。
(3) 人耳对语音信号的相位变化不敏感。
合适的分析表明:语音压缩编码的极限速率为 80 ~ 100 bit/s。
◆此时,只能传送句子内容,
讲话者的音质、音调等重要信息已全部丢失。
9.1.2 语音编码的关键技术
关键技术包括:LPC 分析、合成-分析法、感觉加权滤波器
1. LPC 分析
◆LPC 分析是常用技术,在语音识别、语音合成、语音编码和
说话人识别等领域获得成功的应用。
◆LPC 编码基于跟踪波形的产生过程,而不是波形本身,
它传送的是反映整个过程变化的参数。
◆LPC 基于全极点模型、时域方均误差最小准则估计模型参数。
◆应用这组模型参数能够有效地降低语音信号的编码速率。
语音信号存在短时相关性和长时相关性两种。
利用 LPC 对语音进行这两种相关性的去相关处理后,得到的是预测残差信号。
图9.2:含两种相关性的语音生成模型示意图。
◆短时相关性的传输函数为:
◆长时相关性(谱的精细结构)模型的传输函数为:
式中 T —— 基音周期。
b-q,b-q+1,…,br —— 长时预测系数,
个数在 1 (q = r = 0) 到 3 (q = r = 1) 之间;
◆通常,长时预测系数的更新周期约为 50 ~ 200 次/s。
◆长时滤波是估算短时残差信号中脉冲的周期、相位和增益,
◆ 再去除这些脉冲,得到了
长时滤波残差。
◆再编码,形成激励信号。
2. 合成-分析法
在 LPC 算法中,对残差信号直接量化,且使其误差最小,
并不能使得原始语音信号和重建信号间的误差最小。
采用合成-分析法(AbS) 来求得残差信号的编码量化值,
才能使重建语音与原始语音的误差最小。
AbS是将综合器引入到编码器中,并与分析器结合,在编码器中生成和解码器端相同的重建合成语音。
◆根据误差原则,调整参数使合成语音与原始语音的误
您可能关注的文档
- 数控机床加工程序编制第4版课件作者顾京主编第5章节加工中心的程序编制.ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第3章节).ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第4章节).ppt
- 数控机床控制技术与系统第2版课件作者王侃夫上海市职业技术教育课程改革与教第六章节数控机床伺服系统.ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第5章节).ppt
- 数控机床控制技术与系统第2版课件作者王侃夫上海市职业技术教育课程改革与教第四章节驱动装置.ppt
- 液压与气压传动第2版课件作者刘延俊主编5 液压阀.ppt
- 液压与气压传动第2版课件作者刘延俊主编6 液压辅助元件.ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第7章节).ppt
- 数字设计基础双语教学版课件作者英BarryWilknson双语课件(第8章节).ppt
- 小学五年级上册数学期末考试试卷及参考答案【预热题】.docx
- 《 备考指南 政治 》课件_必修1 第1课.doc
- 小学五年级上册数学期末考试试卷含答案【培优a卷】.docx
- 小学五年级上册数学期末考试试卷含答案【培优a卷】.docx
- 初中信息技术教学中虚拟现实技术应用的实践探索教学研究课题报告.docx
- 2025届高考语文一轮复习专题二现代文阅读Ⅱ学案新人教版.doc
- 6 《健身俱乐部会员流失原因探究与会员行为分析策略》教学研究课题报告.docx
- 高中信息技术编程思维训练课程的开发与应用教学研究课题报告.docx
- 【计算机、 通信和其他电子设备制造业】XX汽车电子有限公司XX项目职业病危害控制效果评价报告书.pdf
- 小学五年级上册数学期末考试试卷含答案(综合卷).docx
文档评论(0)