基于语支鉴别性的音素相关语种识别方法.pdfVIP

基于语支鉴别性的音素相关语种识别方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语支鉴别性的音素相关语种识别方法 王宪亮,万玉龙,杨琳,周若华,颜永红 中国科学院声学研究所语言声学与内容理解重点实验室,北京100190 摘要:本文提出一种音素相关特征,并将语言学中语支的思想引入语种识别。结合音素 相关特征和因子分析方法,提出音素层语支变化量(PLBV)方法。通过对音素后验概率进 行降维和均值方差规整,得到音素相关特征。使用因子分析技术将各语支变化量空间的 低维变化量凶子进行拼接得到音素层语支变化量因子,然后在语支内部和语支间分别对 语支变化量凶子进行支持向量机(SVM)建模。实验基于俄语音子识别器,在美国国家标 准技术署洲IST)2011年语种识别评测(LRE)30s数据集上的实验表明,提出的方法与传统 的ivector系统相比,在EER、minDCF和NIST2011年LRE评价指标上相对提升 29.9%.54.6%。 关键词:音素相关特征语支鉴别性因子分析语支变化量因子 1 介绍 语种识别是通过对给定的一段语音进行分析处理,从而判断其所属语种类别 的过程。主流的语种识别系统包括基于声学层特征和音素层特征两种建模方式【lJ。 Mixture 常用的声学层建模方式有高斯混合模型(GaussianModel,GMM)12J和支 Vector 持向量机模型(SuppoIrt 方法的提出,使语种识别的性能有了很大的提升【4】【5】。音素层特征由于其丰富的 发音信息在语种识别中获得很好的性能。 随着语种识别技术的发展,语种识别越来越重视语种对之间的鉴别性。在美 1年语种识别评测(LRE)中16】,更多易混淆的语种作为 国国家标准技术署(NIST)201 识别的目标语种,并且重点考察最易混淆的语种对的识别情况。因此,寻找更好 的语种建模方式以提高易混淆语种的鉴别能力对语种识别性能有重要的影响。 本文将语言学中语支的思想引入语种识别,提出音素层语支变化量(PLBV) 方法,方法目的在于提高易混淆语种之间的鉴别性。首先基于音素识别器pJ得到 音素相关特征,然后对音素相关特征进行因子分析。从语言学角度来说,不同语 种可以属于不同的语支。提出的方法考虑了语支内部和语支间的鉴别能力,分别 在因子层和模型层提高语种对之间的鉴别性。本文大致分为以下几个部分:第二 节介绍音素相关特征的提取过程;第三节详细介绍PLBV方法;第四节是实验设 置和实验结果;第五节是本文的总结。 2音素相关特征 音素相关特征的提取过程如图1所示。 .288. 音频声学 首先将每一帧语音信号转换为音素后验概率,音素后验概率基于布尔诺科技 大学 图1音素相关特征提取流程图 (Bmo of UniversityTechnology,BUT)的音素识别器【71得到。然后将后验概率转换 到对数域,从而使特征具有更平滑的锐度。主成分分析(PrincipalComponent Analysis,PCA)对特征进行去相关和降维,得到特征空间具有最高变化量的维数, 同时尽可能的减小特征信息的损失。最后通过均值方差规整(MVN)将每一帧的特 征规整到均值为0,方差为1。我们将规整后的特征叫做音素相关特征。 3音素层语支变化量方法 3.1语支 根据语言的历史渊源、地理位置、亲属关系,世界上的语言可以分为若干语 系,语系又可分为若干语支。语系由一组在历史语言学中衍生于同一祖先的语言 组成。同一语系内拥有共同语言特征的语种又构成语支。例如斯洛伐克语系可分 为东斯洛伐克语支和西斯洛伐克语支。 同一语支的成员根据对比语言学,遗传相关性或者关联语言建立。如果一种 语言衍生于另一种语言,如印地语和乌尔都语,或者两种语言来自于同一个祖先, 如捷克语和斯洛伐克语,那么认为这两种语言是遗传相关的。如果几个语言相互 影响,如混合语,语言迁移,或者词语相互借鉴,由于语言间不可分割的关系, 也将它们看作同一语支。 3.2音素层语支变化量方

文档评论(0)

whl005 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档