- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * 参数编码的基本思想是利用语音信号生成的声学模型,通过信号分析技术获得关于该模型的频谱包络、基音周期、清浊音判断等的相关信息,在接收端通过这些信息来合成还原语音信号 三种参数编码器 通道声码器 共振峰声码器 线性预测(LPC)声码器 * 线性预测(LPC)声码器 输入 语音 线性预测分析器 编码器 基 音 检测器 解码器 线性预测合成器 激励信号产生器 合成 语音 LPC声码器原理图 发送端 接收端 基于全极点模型的LPC分析 编码参数:LPC参数、基音周期、增益、清浊判断 不对预测残差信号进行量化和传输(因此无法得到原来的波形) * LPC参数的编码 10阶的全极点模型LPC分析 LPC参数的选择 预测系数 ai 量化误差容易导致系统不稳定(合成滤波器的极点在单位圆外) 一般不直接对预测参数编码传输 反射系数 ki 可以保证合成器的稳定,但是不同的ki值对量化误差的敏感度不一样,需要采用非均匀量化 用于LPC-10声码器 线谱对参数LSP 是最常用的LPC编码参数 量化误差相对独立,即单个LSP参数的量化误差只会影响其所对应的共振峰的频谱包络,不会影响真个频谱 ki和LSP都可以从ai中很容易求得 * LPC声码器的相关标准 1976年美国军方确定LPC-10作为2.4 Kbps速率编码器的推荐编码方式 1985年美国官方接受LPC-10作为联邦标准(FS-15) 速率极低 合成语音质量很差、很不自然,主要是因为在清浊音的判断以及基音周期的提取上不够准确,合成激励源信号和原来的LPC预测误差信号相差较大 1986年美国第三代保密电话装置(STU-III)采用了LPC-10的增强型, LPC-10e 改善了激励源:混合激励代替LPC-10中的二元激励;激励脉冲加抖动处理;多脉冲激励 改进基音提取算法 采用LSP代替ki * 原始语音 低通滤波 100~3600Hz A/D变换8KHz,12bits 预加重 计算分析相位 基音分析存储器 低通滤波器 清/浊音检测 2阶逆滤波 AMDF基音提取 基音及清/浊音校正 预测器分析存储器 计算RMS 计算预测系数 2帧参数存储器 2帧参数存储器 参数编码 误差校正和映射 并变串及同步产生 编码语音输出 pitch V/UV RMS RC LPC-10的编码器框图 原始语音经过一低通滤波器之后,输入A/D转换器中,以8KHz速率采样得到数字化语音,然后每180个采样分为一帧(22.5ms),以帧为处理单元,提取语音特征参数并加以编码传送。A/D变换后输出的数字化语音,经低通滤波,2阶逆滤波后,再用平均幅度差函数(AMDF)计算基音周期,经过平滑、校正得到该帧的基音周期。同时对低通滤波后输出的数字语音进行清/浊音检测,经平滑、校正后得到改正的该帧的清/浊音标志。 * 编码语 音输入 并变串及同步检测 误差检测 校正解码 参数 解码 帧块到基音块的转换与插值 反射系数转换成预测系数 基音产生 噪音产生 清/浊音开关 综合器 计算增益 输出存储器 去加重 D/A变换 低通滤波3600Hz 合成语音输出 RMS RC pitch V/UV 在收端首先通过查表,对码流进行检错、纠错,经过纠错译码后即可得到基音周期、清/浊音标志、增益以及反射系数的数值。译码结果延时一帧输出,使得输出数据可以在过去一帧、现在一帧、将来一帧三帧内进行平滑。由于每帧语音只传输一组参数,考虑一帧内可能有不止一个基音周期,因此要对接收数值进行帧块到基音块的转换和插值。 LPC-10的解码器框图 * 浊音 清音 Pitching/voicing 7 7 RMS 5 5 sync 1 1 k1 5 5 k2 5 5 k3 5 5 k4 5 5 k5 4 k6 4 k7 4 k8 4 k9 3 k10 2 误差校正 0 20 总计 54 53 LPC-10的码本设计 * LPC-10声码器合成语音与原始语音的比较 LPC系统中,全部参数量化为2.4kb/s,如果不考虑信道误码,可懂度得分: 3.6KHz原始语音 LPC-10合成语音 DRT 高于95% 90%正确 DRT(有噪声) 92%~93% 高于82%正确 DAM 高于65 48 * 语音混合编码 LPC声码器的主要问题:过于简化的二元激励源(周期脉冲或随机噪声)是导致合成语音质量较差的根本原因 混合编码的基本方法就是在LPC声码器的基础上,采用更高质量的波形编码算法来优化激励源信号 激励源采取周期脉冲和噪声信号的混合体(语音的长时 相关模型) 闭环搜索算法—合成分析法(
您可能关注的文档
最近下载
- 《解析几何》教案--吕林根,许子道.pdf
- 美国加州桥梁抗震caltrans seismic design criteria vlysis.pdf VIP
- 2025云南省临沧市市级单位公开遴选(选调)工作71人笔试参考题库附答案解析.docx VIP
- HSE保障措施优化及实施方案研究.docx VIP
- 2025甘肃省公路交通建设集团武仙公路收费运营人员招聘61人笔试模拟试题及答案解析.docx VIP
- 2025年秋新鲁科版英语四年级上册全册课件.pptx
- 颚式破碎机技术参数.docx VIP
- 2024河南资本集团“方舟”第三批招聘41人笔试参考题库附带答案详解.pdf
- 《时尚配饰设计》课件.ppt VIP
- 高边坡专家论证PPT汇报材料(中建).ppt VIP
文档评论(0)