汉语广播电视新语音识别.pdf

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多
汉语广播电视新语音识别

摘要 摘 要 /日前,以汉语广播电视新闻语音为对象的语音识别技术的研究,对于语音识 别的实用化发展具有非常重要的意义a本文针对汉语广播电视新闻语音识别的 技术难点,主要进行r以下几个方面广泛而深入的研究。 首先:在广播电视新闻语音的连续语音分割方面,本文提出基于检测熵变换 趋势的音频特征跳变点检测方法,用来检测连续音频信号中的声学特征发生改 变的地方。f这种方法是根据一段数据窗内的每一个可能的声学特征跳变点所分 割的两段语音信号的熵的变化趋势来确定声学特征跳变点。相比于国际上通用 的基于BIC准则的声学特征跳变点检测方法,本文提出的音频特征跳变点检测 方法具有较高的灵敏度和较鲁棒的检测门限,可以较好的适应各种场合的声学 特征跳变点的检测。1 其次:在广播电视新闻语音识别的自适应方面,本文详细分析了国际上通用 的各种广播电视新闻识别系统的自适应算法的优点和缺点。f特别针对基于自适 应回归树的MLLR算法需要依靠先验知识来决定自适应变换类的这一缺点和不 足,提出一种基于目标驱动的多层自适应算法。这种自适应算法能够根据自适 应数据的似然概率的增加来动态的决定自适应变换类的种类和数目,可以更加 充分的利用有限的自适应数据进行自适应,提高系统的识别率。J 最后:在广播电视新闻的连续语音识别方面,本文基于现有的广播电视新闻 的连续语音识别系统在处理相关性特征建模这个问题上的缺点和不足,结合特 缸层的线性旋转变换和模型层的方差建模技术,提出一种用方差建模技术来实 现的共享状态空间旋转变换矩阵的相关特征建模方法。.这种方法利用基于状态 的旋转变换方法的解相关作用,在变换后的不相关的特征空间上建立高精度的 具有对角方差结构的混合高斯模型。f同时又利用方差建模技术来进行状态空问 变换矩阵的参数共享和参数优化,克服了基于状态的特征旋转变换方法所导致 的模型参数数目过多、解码时计算垂较大的缺点。在汉语普通话连续语音测试 和广播语音的连续语音测试中,本文提出的相关性特征建模方法在增加较少的 内存占用量和解码讨算量的情况下,能够比采用传统的具有对角方差结构的高 蜥混合模型的建模方法获得20%的相对误识率的降低。1。 关键词: 广播电视新闻语音识别;连续音频分割f说话人自适应 特征空间旋转变换;方差建模技术. Abstract Abstract Inthe ten hasbeenmadeinthestate—of-the—art past years,greatprogress laboratory the focusof research speech—recognition hasshiftedfrom system.Recentlyspeech read tOthe data foundinthe realworld—like overradio speechspeech broadcastnews and the three of have the TV.During yearsmyPh.D.study,I investigatedkey of mainresearchwork technologies building broadcastingrecogn

文档评论(0)

chuotuo0075779 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档