声学建模中若干题的研究.pdfVIP

  • 9
  • 0
  • 约8.34万字
  • 约 77页
  • 2016-03-02 发布于贵州
  • 举报
声学建模中若干题的研究

声学建模中若干问题的研究 摘要 在信息爆炸并且更多的信息是通过音频视频作为载体来进行传 播的年代,如何快速、高效的把相关的信息分类,并且从中找出我 们需要的部分就成为现实生活中需要面对的事情,这也是连续语音 识别的发展趋势。 广播语音由于具有复杂背景环境和非特定人等特点,再加上近 乎于海量的数据,使得人工分类和标注变得越来越不可行。我们需 要系统能够通过前期少量的未标注或者部分标注的数据来选择其他 更有用的数据,用来提高声学模型的识别率,以此减少人工标注和 使用全部数据所带来时间和精力上的浪费。本文通过对广播语音数 据特点的分析,选择适当的规则建立广播语音库,以及建立相应的 广播语音标注系统。同时通过设计主动学习算法,搭建主动学习系 统,通过对于初始样本随机选择和K—L距离选择的比较,以及其他 训练样本中随机选择,最大似然(MLE)和后验概率的实验比较中, 得出使用K.L距离选择初始样本,并且用基于混淆网络的后验概率 选择相应的样本可以大大节省标注量,提高系统效率。此外,本文 还进行了声韵母基元模型和音素基元模型对于连续语音识别性能的 比较,结果显示声韵母更适合中文的声学建模。 关键词广播语音广播语音库标注系统主动学习样本选择后验 概率基元模型 THERESERCHTHE ABOUTACOUSTICMODEL ABSTRACT Inthe informationhavetofacea numberofaudioand age,we large a thathowtoclassthesimilarinformationandfind video,and problem theuseful isalsothetrendofcontinuous part.This speechrecognition. containsthe BroadcastingSpeech followingfeatures:complex background andmassiveamountof environment,speakerindependent data.Weneedthe alittledatatobuildabase then systemusing line,and someunlabeledbutmostinformativetoannotate selecting samples them, and the transcribedtothe setto addingnewly samplestrainingupdate theacousticmodel.Inthis can reduce way,wegreatly thenumberof transcribed.Inthis thefeaturesof samples paper,weanalyze somerulesfor the broadcastingspeech,select buildingbroadcasting databaseandthetranscribe thesame speech

文档评论(0)

1亿VIP精品文档

相关文档