汉语广播电视新闻语音识别-模式识别与智能系统专业论文.docxVIP

汉语广播电视新闻语音识别-模式识别与智能系统专业论文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要摘要/日前,以汉语广播电视新闻语音为对象的语音识别技术的研究,对于语音识别的实用化发展具有非常重要的意义a本文针对汉语广播电视新闻语音识别的技术难点,主要进行r以下几个方面广泛而深入的研究。首先:在广播电视新闻语音的连续语音分割方面,本文提出基于检测熵变换趋势的音频特征跳变点检测方法,用来检测连续音频信号中的声学特征发生改变的地方。f这种方法是根据一段数据窗内的每一个可能的声学特征跳变点所分割的两段语音信号的熵的变化趋势来确定声学特征跳变点。相比于国际上通用的基于BIC准则的声学特征跳变点检测方法,本文提出的音频特征跳变点检测方法具有较高的灵敏度和较鲁棒的检测门限,可以较好的适应各种场合的声学特征跳变点的检测。1其次:在广播电视新闻语音识别的自适应方面,本文详细分析了国际上通用的各种广播电视新闻识别系统的自适应算法的优点和缺点。f特别针对基于自适应回归树的MLLR算法需要依靠先验知识来决定自适应变换类的这一缺点和不足,提出一种基于目标驱动的多层自适应算法。这种自适应算法能够根据自适应数据的似然概率的增加来动态的决定自适应变换类的种类和数目,可以更加充分的利用有限的自适应数据进行自适应,提高系统的识别率。J最后:在广播电视新闻的连续语音识别方面,本文基于现有的广播电视新闻的连续语音识别系统在处理相关性特征建模这个问题上的缺点和不足,结合特缸层的线性旋转变换和模型层的方差建模技术,提出一种用方差建模技术来实现的共享状态空间旋转变换矩阵的相关特征建模方法。.这种方法利用基于状态的旋转变换方法的解相关作用,在变换后的不相关的特征空间上建立高精度的具有对角方差结构的混合高斯模型。f同时又利用方差建模技术来进行状态空问变换矩阵的参数共享和参数优化,克服了基于状态的特征旋转变换方法所导致的模型参数数目过多、解码时计算垂较大的缺点。在汉语普通话连续语音测试和广播语音的连续语音测试中,本文提出的相关性特征建模方法在增加较少的内存占用量和解码讨算量的情况下,能够比采用传统的具有对角方差结构的高蜥混合模型的建模方法获得20%的相对误识率的降低。1。关键词:广播电视新闻语音识别;连续音频分割f说话人自适应特征空间旋转变换;方差建模技术.AbstractAbstractInthepasttenyears,greatprogresshasbeenmadeinthestate—of-the—artlaboratoryspeech—recognitionsystem.RecentlythefocusofspeechresearchhasshiftedfromreadspeechtOthespeechdatafoundintherealworld—likebroadcastnewsoverradioandTV.DuringthethreeyearsofmyPh.D.study,Ihaveinvestigatedthekeytechnologiesofbuildingbroadcastingrecognitionsystem.Themainresearchworkfocasedonthefollowingthreeaspects:Iproposedanovelmethodforacousticchangepointdetection.whichiSimportantfortheimprovementofperformanceofbroadcastingsegmentationsystem.Themethodproposedheredetectstheacousticchangepointsbycheckingthechangingtrendofdividingentropyofeverysignalpointsinaslidingwindow.ComparedwiththetraditionaJdetectionmethodbasedonBayesianInformationCriterion(BIC),themethodcandetecttheacousticchangepointmoreaccurately,especiallyformatbetweentwoshortsignals.TheMLLRadaptationmethodhasbeenwidelyusedinthespeechrecognitionsystem.ThetraditionalMLLRadaptationmethoddefinestheregressionclassesbasedontheassumptionthata11theoutputdistributionscloseinoriginalacousticfeaturespaceshouldbetiedandtransforme

您可能关注的文档

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档