- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
听感相似韵母的SVM分类器设计
第八届中国语音学学术会议
暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会 中国北京2008.4.18-4.20
听感相似韵母的SVM 分类器设计
王孟杰 孟子厚
中国传媒大学传播声学研究所 北京 100024
摘要 在语音识别和评测中,错误大多发生在语 韵母的知觉相似度聚类图见图 1。其中
音的最小对立体之间。本文根据张家騄等对汉
S 代表该水平坐标线的语音相似度,在
语的韵母进行的知觉相似度实验的结果,针对 ij
图中,沿纵轴向下的韵母对的语音相似
在听感上相似度最大(S ≥ 0.15 )的6 对韵母
ij 程度逐步增加。从图中可以发现,韵母
设计分类器,分别为(iong,ian ),(
ün ,in ),
中语音相似度较高(S ≥ 0.15 )的对立
ij
(i,ü ),(üe ,ie ),(uang ,iang ),(uo ,e )。
使用基于MFCC 的参数。在时间坐标上分段求 有6 对,即(iong,ian ),(
ün ,in ),(i,
取均值获得每个语音样本的39 维参数。模型训 ü ),(üe ,ie ),(uang ,iang ),(uo ,e )。
练使用核函数为RBF 的SVM。男声、女声以及 针对这种在语音中相似度高的韵母对,
男女混合样本集外测试准确率基本在 95% 以 本文尝试使用统计学习理论中支持向量
上,且准确率受性别影响不大。 机(SVM )的方法进行分类器的设计。
1 引言
在汉语中,除了元音、辅音音位系统
之外,研究中使用得比较多的还有更符
合汉语语音特点的声母、韵母音位系统。
语音识别中的错误大多发生在语音的最
小对立体之间,在汉语语音的评测中,
评测的重点也是在汉语中相似度高的对
立体之间的区分。另一方面,语音学上
区别特征系统的建立和完善也需要汉语
语音处理实践的支持[1][2] 。研究韵母音位
之间的区分问题[4][5],不但在言语工程上
有重要意义,也可以对汉语区别特征的
[1]
研究提供参考 。 图1:汉语普通话韵母知觉相似度聚类图 。
为了确定汉语的音位系统,张家騄等
[1][3]对汉语的声母和韵母进行了知觉相 2 参数提取
似度的实验。利用普通的听力正常的听 MFCC (Mel-Frequency Cepstral
音人,在不同的传递条件下所作的语音 Coefficients )参数利用了人耳的听觉特
清晰度实验数据,建立语音混淆矩阵, 性,在语音信号处理中有广泛的应用。
第八届中国语音学学术会议
暨庆贺吴宗济先生百岁华诞语音科学前沿问题国际研讨会 中国北京2008.4.18-4.20
本文中 SVM 分类器中也是使用了基于 间段内语音帧的MFCC 参数进行平均,
MFCC 的参数。MFCC 参数提取的具体 每一段得到 13 维的平均后的 MFCC 参
流程见图2. 数,把三部分的参数按顺序拼接起来,
即是本文所使用
文档评论(0)