- 9
- 0
- 约8.34万字
- 约 77页
- 2016-03-02 发布于贵州
- 举报
声学建模中若干题的研究
声学建模中若干问题的研究
摘要
在信息爆炸并且更多的信息是通过音频视频作为载体来进行传
播的年代,如何快速、高效的把相关的信息分类,并且从中找出我
们需要的部分就成为现实生活中需要面对的事情,这也是连续语音
识别的发展趋势。
广播语音由于具有复杂背景环境和非特定人等特点,再加上近
乎于海量的数据,使得人工分类和标注变得越来越不可行。我们需
要系统能够通过前期少量的未标注或者部分标注的数据来选择其他
更有用的数据,用来提高声学模型的识别率,以此减少人工标注和
使用全部数据所带来时间和精力上的浪费。本文通过对广播语音数
据特点的分析,选择适当的规则建立广播语音库,以及建立相应的
广播语音标注系统。同时通过设计主动学习算法,搭建主动学习系
统,通过对于初始样本随机选择和K—L距离选择的比较,以及其他
训练样本中随机选择,最大似然(MLE)和后验概率的实验比较中,
得出使用K.L距离选择初始样本,并且用基于混淆网络的后验概率
选择相应的样本可以大大节省标注量,提高系统效率。此外,本文
还进行了声韵母基元模型和音素基元模型对于连续语音识别性能的
比较,结果显示声韵母更适合中文的声学建模。
关键词广播语音广播语音库标注系统主动学习样本选择后验
概率基元模型
THERESERCHTHE
ABOUTACOUSTICMODEL
ABSTRACT
Inthe
informationhavetofacea numberofaudioand
age,we large
a thathowtoclassthesimilarinformationandfind
video,and
problem
theuseful isalsothetrendofcontinuous
part.This speechrecognition.
containsthe
BroadcastingSpeech followingfeatures:complex
background andmassiveamountof
environment,speakerindependent
data.Weneedthe alittledatatobuildabase then
systemusing line,and
someunlabeledbutmostinformativetoannotate
selecting samples them,
and the transcribedtothe setto
addingnewly samplestrainingupdate
theacousticmodel.Inthis can reduce
way,wegreatly thenumberof
transcribed.Inthis thefeaturesof
samples paper,weanalyze
somerulesfor the
broadcastingspeech,select buildingbroadcasting
databaseandthetranscribe thesame
speech
您可能关注的文档
- 壳聚糖对辣椒疫的抑制及转录组分析.pdf
- 复方中草药对吉罗非鱼免疫相关基因表达的影响.pdf
- 复凝聚法制备豚提取物微胶囊剂的研究.pdf
- 夏季湖光岩玛珥浮游细菌和浮游活性菌遗传多样性的比较.pdf
- 外源性水杨酸诱月季对黑斑病抗性的研究.pdf
- 外源激素对百子花葶矮化的研究.pdf
- 多媒体技术在森资源地理信息系统中的应用.pdf
- 多年生黑麦草人诱发变异的多态性分析与鉴定.pdf
- 多分辨率遥感森类型识别的尺度效应分析.pdf
- 外源基因在转基741杨杂交子代中的遗传和表达研究.pdf
- 小区绿化施工协议书.docx
- 墙面施工协议书.docx
- 1 古诗二首(课件)--2025-2026学年统编版语文二年级下册.pptx
- (2026春新版)部编版八年级道德与法治下册《3.1《公民基本权利》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《4.3《依法履行义务》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.2《按劳分配为主体、多种分配方式并存》PPT课件.pptx
- (2026春新版)部编版八年级道德与法治下册《6.1《公有制为主体、多种所有制经济共同发展》PPT课件.pptx
- 初三教学管理交流发言稿.docx
- 小学生课外阅读总结.docx
- 餐饮门店夜经济运营的社会责任报告(夜间贡献)撰写流程试题库及答案.doc
原创力文档

文档评论(0)