自动语言辨识方法研究论文.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
自动语言辨识方法研究 魏鑫屈丹王炳锡 (信息工程大学郑州市1001信箱306号450002) 摘要 自动语言辨识就是利用计算机分析处理语音片段以判别其所属语言的过程.本文描 述了自动语言辨识的可获信息,并且对语言辨识的各种系统进行了探讨,包括传统 上采用的语言辨识方法,和当前的在标准数据库上得以检测的系统,以及未来较有 发展前途的方法.最终给出了比较结果. 关键词 自动语言辨识频谱相似性音素识别单词层次连续语音识别 1前言 语音的自动语言辨识技术(LID)就是利用计算机分析处理语音片段以判别其所属语言的 过程,其在信息检索和军事领域中都有很重要的应用,主要包括以下几个方面: 多语言信息服务:在可提供多语言服务的信息查询中,一开始必须用多种语言提示用户 选择用户语言。语种识别系统必须预先区分用户的语种,以提供不同语言的服务。这类典型 例子有旅游信息、应急服务、购物、银行、股票交易等。例如ATT推出了语言热线翻译服 J。 务,帮助警察局处理紧急呼救电话II 机器翻译系统的前端处理:直接将一种语言转换成另一种语言的通信系统,必须首先确 定使用者的语言;对大量录音资料进行翻译分配时,也需要预先判定每一段语音的语言种类。 还有,军事上对说话人身份和国籍进行判别或监听。 随着信息时代的到来以及国际互联网的发展,语种识别越来越显示出其应用价值,国际 上也一直进行着卓有成效的研究和系统开发。 2语言辨识的有效信息 人和机器可以利用很多方面的信息来区分不同语言。文献【2】从语言学角度深入探讨了特 定语言问的区别,而Muthusamy等人【3l研究分析了人的语言辨识能力。总结起来,不同语言 间的差别信息可以归纳为以下几个层次: 音韵学 音素是语言的音韵单元的基本心理表示。即使很多语言具有一个共同的音素子 集,任何两种语言的音素和音素集也是有差别的,且音素的出现频率也不相同。还有音素配 位学信息,每种语言都有一种制约不同音素排列组合的规律,例如,德语里单词“spiel”发音 为/sh 1/,如果用英语拼写则为“shpeel”,以一个辅音类/shp/开始,但这种情况在英语里是 Piy 不可能出现的。 韵律学不同语言的时长特征、说话速率、基音轮廓(语调)和重音等有很大差异。 词 法不同语言的词根和词素通常也不同,每种语言都有自己的词汇表和构词方式。 641 句法不同语言的句子模式不同,即使两个句子同时含有一个词,例如英语和德语中 同时具有一个词‘‘bin”,但这个词前后的词可能不同。 3LID系统 自动语言辨识的研究可以追溯到19世纪70年代,在过去的20年中,与语音识别的其它 领域相比较,自动语种识别进展较为缓慢,直到90年代,才得到进一步发展。图l示意了LID 系统的两个阶段。在训练阶段,不同语言的语音 数据进入系统,转换成特征向量序列,根据某种 训练算法,每种语言产生一个或多个模型。识别 阶段,从新的语音段中计算相同的特征向量与每 个语言模型进行比较,计算该语音在每种模型下 的概率,产生最大概率的语言就判定为识别语言。 LID系统随着所利用差别信息的不同和语言 模型建立的方法的不同而不同,下面我们总结一 些具有代表性的LID方法: 图1语言辨识(LID)的两个阶段 (1)频谱相似性方法 在早期的LID系统中,开发人员主要利用不同语言间的频谱特征差别,传统的频谱相似 性方案主要有两种:一种是直接从训练语音中提取一系列短时频谱特征向量,利用K.均值聚 类算法形成各语种的训练模板,将测试语音特征向量序列分别用每种语言模板进行矢量量化, 找到累积失真距离(欧式距离、Mahalanobis距离等)最小的语言。另一种是在这种矢量量化 方法的基础上,应用GMM(混合高斯模型)分类器对语言进行建模。训练过程中,每种语言 产生一个高斯混合模型,识别时计算各种模型产生测试语音特征向量的概率,

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档