- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
增强型语音质量观评估算法研究.pdf
摘要
增强型语音质量客观评估算法研究
摘 要
语音质量评估技术在当今语音编码和语音通信系统中已发挥越来
越重要的作用 语音质量的评估主要有客观和主观方法两类 主观评
价方法能真实反映出语音信号的质量 但是需要耗费大量的人力 物
力和财力 而且具有不可重复性 客观方法一般适用于高码率的语音
波形编码系统 在低码率系统中 客观评价值往往与语音的主观质量
之间存在较大的偏差 因而设计 研究一种既容易实现又和主观评估
结果在统计意义上高度相关的语音质量评估算法具有重要的理论意义
和实用价值
本文详细介绍了语音信号质量评估的现存算法 并深入推导了巴
克谱失真 BSD 测度算法 针对 BSD 测度存在的局限性 本文在
BSD 测度的基础上 引入了人耳掩蔽效应对主观感知的影响 并结合
噪声帧与弱音帧占处理的信号帧总数的比率 nm 这一影响语音质量
的要素提出了一种增强的语音质量评估算法 本文称之为增强型巴克
谱失真测度 IBSD 测度 本算法提高了估计值和主观评估结果之间
的相关性 并且本文给出的语音质量估计公式使得语音质量估计值和
平均意见得分 MOS 具有更加直观的联系
巴克谱失真测度是语音质量的一种客观评价方法 定义为原始信
I
摘要
号与编码信号巴克谱向量欧氏距离的平均值 这种测度的定义与主观
感觉比较吻合 模仿了人耳的一些听觉特性 如在频谱幅度域考虑了
听觉响度的对数规律 考虑了等响度曲线的补偿等等 但它只是通过
根据经验得到的能量门限来决定是否处理某段数据 仍然把一部分人
类听觉感受不到的声音包含到失真的计算中 从而降低了与主观感知
的相关性
本文针对巴克谱失真测度存在的问题作了改进 把噪声掩蔽门限
的概念引入到传统的BSD 测度中去 因为低于噪声掩蔽门限的噪声是
不被感知的 所以这部分噪声谱成分不参与BSD 测度的计算 本文把
计算得到的结果称为改进的巴克谱失真测度 MBSD 测度 这样做
充分地模拟了人耳的掩蔽效应 另外 本算法根据人耳的感知特性
把待测信号的帧分为噪声帧 弱音帧和正常帧三个部分 因为噪声帧
和弱音帧的比率的大小可以反映出编码信号的失真程度 将它与
MBSD 测度相结合 最终得到评估语音质量的增强型算法IBSD 算法
为了使语音质量估计值和主观评价值特别是 MOS 分之间具有较
为直观的联系 IBSD 测度设计了一个使估计值能够落在 0~1 范围内
的评价公式 其中 1 表示语音信号无失真 0 表示语音信号质量很差
本文对大量已知 MOS 值的编码信号进行处理并计算得到它们的
MBSD 值和nm 代入到估计公式中 获得一组关于估计公式系数的非
线性方程组 再用求解无约束条件下的优化问题得到系数的值 从而
构造一个和主观语音质量高度相关的语音质量估计公式
II
摘要
最后 本文进行了多组数值实验 对各种不同的编码器分别以男
声 女声和混合声测试了 BSD MBSD 以及 IBSD 算法的测度值与
MOS 之间的相关性 实验数据表明 对于各种考察对象而言 采用
IBSD 测度得到的语音质量估计值和MOS 之间的相关系数与用另两种
测度得到的值相比 都有所提高
关键词 语音质量评价 巴克谱失真测度 噪声帧 弱音帧
III
摘要
RESEARCH OF IMPROVED OBJECTIVE SPEECH
QUALITY EVALUATIO
文档评论(0)