汉语广播语音识别系统的分析-模式识别与智能系统专业论文.docxVIP

汉语广播语音识别系统的分析-模式识别与智能系统专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘要 摘要 摘要 广播语音识别技术的研究是当前大词汇量连续语音研究的一个热点问题。广 播电视新闻节目包括了说话人、方言口音、声道变化、声学环境的一系列声学 的复杂特征,对于语音技术的实用化研究是一种理想的研究对象,对于语音技 术走向实用化方砸有着重大的意义。本文针对广播语音识别系统中的关键问题, 在以下几个方面进行了广泛和深入的研究。 首先,在广播语音的音频数据切分方面,本文提出了~种基于检测熵变化趋 势的变窗长音频特征跳变点检测方法。本文提出的方法在一个固定的数据窗内, 通过检测窗内所有可能跳变点的熵的变化趋势来最终确定真实的音频跳变点。 这种方法不同于传统的基于BIc准则的音频跳变点检测方法,避免了由于设定 固定门限而导致引起漏检和数据积累带来的累积误差。在分类的过程中,用分 组高斯方法代替传统的高斯混合模型(GMM)分类器,取得了更加准确的分类结 果,实现了快速高效的基于矢量量化的多码本聚类算法。 其次,在广播语音识别系统的自适应训练方面,本文提出了一种基于子空间 聚类的多层MLLR自适应算法,这种算法在子空间框架下对高斯模型进行聚类, 基于目标驱动的原则,通过引入反馈机制,根据自适应数据的似然概率的增加 动态的决定自适应变换类的数目。通过采取子空间聚类的策略,大大减少了待 估计参数的数目。实验结果表明,本方法在自适应数据比较少的情况下,有着 比传统基于自适应回归树算法更高的识别率。在无监督自适应方面,本文对可 信度机制做了一些探讨,通过合理的引入可信度机制可以提高系统无监督自适 应的性能。 最后,在广播语音的声学建模方面,针对现有对角方差建模的缺陷与不足, 在空间旋转变换的理论基础上,结合部分方差共享(sTc)的模型补偿方法,本文 提出一种基于共享状态空间旋转变换的相关特征建模方法(1_ying ssR)。通过状 念空间旋转变换方法(SsR),在变换后的新的特征空间实现解相关的目的,在新 的不相关的空间采用对角方差建模技术对声学特征进行精确建模。以似然概率 损失最小为原则,对变换矩阵进行合并共享,通过BIC准则方法确定最终的合 并类数,最后用部分方差共享技术对变换矩阵的参数进行模型补偿和重估。避 免了由于变换矩阵过多,在识别解码阶段增加系统的存储空间和运算量的增加。 ——:一.垫墨关键词: ——:一.垫墨 关键词: 广播语音识别系统, 音频分割,说话人自适应,方差建模技术 II Abstn目ctAbStraCt Abstn目ct AbStraCt Broadcast news continuous speech reco印ition is hot question.The data in broadcasts not homogeneous,and include series of acoustical characteristic such speaker styles,dialect and accent,ch籼e1 variety柚d acoustical envimnments. Broadcasts are a perfectly research object for StIldy practically about speech techn0109y Aim at several key problems of broadcast news speech recognition,I present the recent pro铲ess on impr0Ving the perfornlallce for mandarin bmadcast news speech recognition system. Firstl y,a noVel method fbr acoustic change poim detection is proposed.The method detects change point by checking enn‘opy change缸℃nd of all signal points in slide shining variable.size data windows.Di日erent fmm订aditional dctect method based on Bayesian Infomation Criterion(BIC),f酗I to detect aIld error acc砌ulation are avoided fbr establishing fixed t11reshold in the checking en仃DpV change methods. On the classification pan,traditional GMM is rcplaced b

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档