网站大量收购闲置独家精品文档,联系QQ:2885784924

听感相似韵母的SVM分类器设计.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
听感相似韵母的SVM分类器设计

第八届中国语音学学术会议 暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会 中国北京2008.4.18-4.20 听感相似韵母的SVM 分类器设计 王孟杰 孟子厚 中国传媒大学传播声学研究所 北京 100024 摘要 在语音识别和评测中,错误大多发生在语 韵母的知觉相似度聚类图见图 1。其中 音的最小对立体之间。本文根据张家騄等对汉 S 代表该水平坐标线的语音相似度,在 语的韵母进行的知觉相似度实验的结果,针对 ij 图中,沿纵轴向下的韵母对的语音相似 在听感上相似度最大(S ≥ 0.15 )的6 对韵母 ij 程度逐步增加。从图中可以发现,韵母 设计分类器,分别为(iong,ian ),( ün ,in ), 中语音相似度较高(S ≥ 0.15 )的对立 ij (i,ü ),(üe ,ie ),(uang ,iang ),(uo ,e )。 使用基于MFCC 的参数。在时间坐标上分段求 有6 对,即(iong,ian ),( ün ,in ),(i, 取均值获得每个语音样本的39 维参数。模型训 ü ),(üe ,ie ),(uang ,iang ),(uo ,e )。 练使用核函数为RBF 的SVM。男声、女声以及 针对这种在语音中相似度高的韵母对, 男女混合样本集外测试准确率基本在 95% 以 本文尝试使用统计学习理论中支持向量 上,且准确率受性别影响不大。 机(SVM )的方法进行分类器的设计。 1 引言 在汉语中,除了元音、辅音音位系统 之外,研究中使用得比较多的还有更符 合汉语语音特点的声母、韵母音位系统。 语音识别中的错误大多发生在语音的最 小对立体之间,在汉语语音的评测中, 评测的重点也是在汉语中相似度高的对 立体之间的区分。另一方面,语音学上 区别特征系统的建立和完善也需要汉语 语音处理实践的支持[1][2] 。研究韵母音位 之间的区分问题[4][5],不但在言语工程上 有重要意义,也可以对汉语区别特征的 [1] 研究提供参考 。 图1:汉语普通话韵母知觉相似度聚类图 。 为了确定汉语的音位系统,张家騄等 [1][3]对汉语的声母和韵母进行了知觉相 2 参数提取 似度的实验。利用普通的听力正常的听 MFCC (Mel-Frequency Cepstral 音人,在不同的传递条件下所作的语音 Coefficients )参数利用了人耳的听觉特 清晰度实验数据,建立语音混淆矩阵, 性,在语音信号处理中有广泛的应用。 第八届中国语音学学术会议 暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会 中国北京2008.4.18-4.20 本文中 SVM 分类器中也是使用了基于 间段内语音帧的MFCC 参数进行平均, MFCC 的参数。MFCC 参数提取的具体 每一段得到 13 维的平均后的 MFCC 参 流程见图2. 数,把三部分的参数按顺序拼接起来, 即是本文所使用

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档