语音句子边界检测的模型及评价标准.docVIP

下载本文档

11
0
约4.04千字
约 5页
2018-02-01 发布于上海
举报
版权申诉

语音句子边界检测的模型及评价标准.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

语音句子边界检测的模型及评价标准

精品论文参考文献语音句子边界检测的模型及评价标准胡改蝶，马建芬 (太原理工大学,计算机与软件学院,太原 030024) 摘要：语音作为一个交叉学科,具有深远的研究和应用价值。语音句子边界检测是语音识别中的一个重要步骤,它可以使语音识别具有更好的可读性，并能使我们理解语言处理模块。本文介绍了语音句子边界检测中常用的模型及评价标准。关键词：边界检测；语音识别；模型；评价标准中图分类号：TN912 文献标识码：A 文章编号：1007-9599 (2010) 05-0000-02 Models and Evaluation Metrics for Sentence Boundary Detection in Speech Hu Gaodie,Ma Jianfen (Taiyuan Technology University,Computer and Software College 030024,China) Abstract:Speech,as a interdiscipline subject has very profound value of research and application.Sentence boundary detection in speech is an important step in speech recognition,it can make speech recognition more readable and enable us to understand language processing modules.This paper introduce common models and evaluation metrics for sentence boundary detection in speech. Keywords:Boundary detection;Speech recognition;Models;Evaluation metrics 一、简介近几年来，人们对语音识别技术产生了广泛兴趣。然而目前的语音识别系统主要以字或词为单位。在这些语音识别系统中，很少提到句子边界检测。但是句子边界检测确实可以使语音识别更具有可读性。语音边界检测是一个分类问题,我们可以根据每个词间的边界来决定它是否是语音句子边界。二、常用的模型（一）隐尔马可夫模型（Hidden Markov model，HMM）最早的句子切分中就已经用到了HMM。设模型的状态对应词wi，结果标志ei。与状态相关的是词以及韵律特征fi。下图给出了SU检测问题的图式模型。图1：SU检测问题的图式模型 HMM中的观察似然度由决策树分类器来实现的，得到产生韵律特征的概率P(fi|ei,wi);用N元语言模型来计算转换概率：P(wiei|w1e1…wi-1ei-1)= P(wi|w1e1…wi-1ei-1)times;P(ei|w1e1…wi-1ei-1ei)。在HMM中，前向-后向算法用来决定每个词间边界的最大后验概率：。 HMM也是一个生成模型方法，这是因为它描述一个隐藏变量（句子边界）的随机过程，而这个过程产生观察数据[5]。 HMM方法有两缺陷：一是HMM的训练不能取正确标记后验概率的最大值。二是基于N元序列模型不能处理词序列的多重特征表示。（二）最大熵后验概率模型最大熵后验概率模型可以解决以上提到HMM的两大缺陷。设边界位置为i，最大熵模型可表示为以下形式： (1) 其中是一个标准化术语，ti表示文本信息，gk（ei，ti，fi）对应所定义的词、韵律的特征。最大熵的模型是由所找到的参数来估计的，在训练数据中，不同的特征功能的期望值EP[gk（ersquo;，w，f）]匹配经验平均值。同时，在训练集中的参数所选择的最大条件似然度prod;iP（ei|w，f）很容易受到(1)式中所给的指数的制约。（三）语言模型（The language model，LM）对于SU边界检测而言，语言模型的目的是模访包含在词序列中的结构信息，我们用一个隐语言模型（Stolcke and Shriberg，1996）去模仿边界类型和词之间的联合分布。W表示一连串口语w1，w2，…wn，E表示词间事件的序列e1，e2，…en。隐藏语言模型描述词与事件之间的联合分布P（W，E）=P（w1，e1，w2，e2，…wn，en）[1]。三、评价标准句子边界检测有许多评价标准，以下描述了一些常用的评价标准。（一）分类错误率（CER）如果决策问题是一个基于词间边界点的分类任务，则分类错误率：其中：fn（false negative）为错误的否定； fp（false posi