基于浊音信息和使h.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于浊音信息和使用HMM的语言识别 斌沪芳之 邓 中山大学计算机科学系 广州 510275 自然状态,说话内容和说话方式 (如声音大小、语速等)不 摘要 受任何限制。电话录音文件没有经过去噪等方面的处理,当 本文提出了一种使用浊音信息表示语言特征,通过计算 中包含有电话的铃声。此外,当说话人打电话时附近电视机 其上的Me]频率倒谱系数 (MFCC),“正向”和 “反向”综 播放的音乐声以及其他一些非话音信息也混入录音文件中 合使用隐马尔可夫模型 (HMM)进行语言识别的方法。对 录音文件的长度也不固定,每个文件约有几分钟。为了方便 新疆维语和J东‘粤语的电话录音进行识别实验,平均正确识 实验,本文截取每段录音文件的前一分钟经过 8kHz,8bit 别率达到8996以上 取样输入计算机,作为本实验的语音材料 1引言 3HMM模型训练 语言识别是目前语音识别研究领域的热点和难点从语 进行语言识别的第一步是建立该种语言的模型,本文使 音学的角度看,音素和音调是区别不同语言的主要语音特 用基于HMM 的工具HTK来建立语言模型并进行识别。由 征,目前的研究也是基于这两个特征进行的。如[l.5〕是从 于使用HTK建立HMM模型时,对用来训练模型的语音材 音素特征来进行识别的,[2,3,创则是基于音调的。从 「卜5〕 料的长度有一定的要求,即存在一个最优值,如果语音材料 的实验方法来看,大多数研究是从直接提取音素或者音调的 太少,训练出来的模型就不能反应语种或者方言的特征,反 特征来进行的,虽然从理论上可以比较有效的区分语言,但 之则可能产生过学习的情况,生成的模型也不利于识别,通 是计算复杂,同时也存在一定的局限性,而且识别率不高 过实验发现,本文分别使用3个维语语音文件和3个粤语语 原因是目前计算机对音素的识别率不高,而音调的动态变化 音文件来训练维语和粤语的模型时,可以取得最佳的识别结 又很大,因此难于在语言识别中直接运用。本文认为蚀音信 果 (表1显示了选择不同个数的文件训练模型时正确识别 号充分包含了语言的元音 (还有部分浊辅音)和音调信息。 率的比较)。使用HTK工具训练模型时,首先要对被训练 使用这一特征可以综台浊音音素和音调的信息,达到区分不 的文件进行标记.生成label文件 (标记文件),然后对这些 同语言的目的。由此本文提出一种采用蚀音信号的Mel频率 Label文件进行vi}练.Label文件可以使用HTK的Hlabel命 倒谱系数 (MFCC)作为语言的特征,正向和反向使用HMM 令通过手工编辑的方法得到,但是由于这种方法工作量很 来进行语言识别的方法 这种方法简单易行,而且可以达到 大,同时本文仅仅考虑提取浊音信息来建立模型,所以只需 较高的正确识别率。HMM是语音识别很成熟的方法。有现成 要对所有的蚀音信号进行标记。根据语音学的知识,基音是 的软件 〔具HTK可以使用6「1。本文对68个维语和139个粤 用来区分清音和蚀音的主要语音特征,我们可以采用基音检 语的电话录音语音文件进行识别实验 (包括男生说话人和 测的方法对这些语音文件自动进行 label,获取其中的浊音 女生说话人),总平均正确识别率达到89%以上。 信息 3.1由墓音自动生成label文件 本文使用w代表维语的话音,使用Y代表粤语的话音。 2电话语音库 首先对用

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档