一种汉语单音节基音提取与声调识别方法.pdfVIP

一种汉语单音节基音提取与声调识别方法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种汉语单音节基音提取与声调识别方法

清 华 大 学 学 报 (自 然 科 学 版) JOURNAL OF TSINGHUA UNIVERSITY Voi30No.41990 第 30卷 第 4期 . 一 种新型汉语单音节识别方法 电子工程系 曹 洪 摘 要 :介绍 了一种新型字基 VQ/HMM 语音识别方法tVQ 与 HMM 分级识别算法 使得 VQ部分可用作语音识别的第一级处理 HMM部分作第=级识别。在第一级识别 中 可弓l进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字 表的实时语音识 别.存贮量、计算量均大大碱少。用此方法把汉语四声作一个 HMM 模型,使汉语 400 个基本音节的识别率达 96% 以上,若加上精确冯声识别剐可识别汉语的 1200种声音 关键词;语音识别。音节 .矢量量化,臆含马可夫模型 0 引 言 目前汉字信息的计算机输入是一项十分复杂的工作 ,它不仅需要用户经过训练,记 忆才能掌握,而且效率低 。汉字信息的计算机输入 问题是中文信息处理的一个难题,我 们试图借助语音识别技木研制一种经济、实用的语音识别卡,使它代替键盘,用声音向 计算机输入汉字信息,为此,研制了一种在 IBM-PC 系列机 上实 现 的语 音 卡,它 能识别汉语所有的 400单音节。汉语仅有 400个基本音节,若考虑四声 发音,仅 有 1200个发音。CCDOS 中的 8O00多个汉字具有许多同音字,因此仍用 CCDOS 中 二次输入的方式,使用户可在若干候选的同音字中选择正确的字,这样可解除对用户的 调练和记忆要求,而使计算机 中文信息处理系统能被更广泛的用户所接受。使用上述方 法的声控 中文打字机,在办公室 自动化中将获得更广泛的应用。语音识别卡采用了一种 新型的特定人的语音识别方法,这种在 VQ/HMM 方法的基础上改造的新算法以96 以上的识别率识别汉语的 400个单音节,从而使语音输入方法与 CCDOS现有的拼音 输入方式兼容。经典的 VQ/HMM 方法… 是一种有效的非特定人的识 别 方 法,实 际上一个人的发音本身也是复杂多变的,VQ/HMM 方法是一种适应性好的统计模 式 识别方法,它能较好地反映某种语声的不变特征,性 能稳 定,与传统 DTW 方法相 比,VQ/HMM 具有更可靠的实用价值。采用 VQ/HMM 方法,IBM 公司研制了一 种 2000o字的语音识别系统 (Tangora一20)[2,31 用于办公室 自动 化 系 统 。基 于 VQ/HMM 的特点和 IBM 公司这一成功的应用,我们在此基础上研究了一种更 为有 效、系统实现大大简化的字基 VQ/HMM 方法:VQ 与 HMM 分级识剐方法。它能 本文于 1989年 4月 3 日收到 清 华 太 学 学 报 第 30卷 在 PC 微机上 以较高性能价格 比实现汉语的计算机输入。 1 VQ 与 HMM 分级识别算法原理 1.1 经典 VQ /HMM 分析 经典的 VQ/HMM 方法与传统 的 DTW 方法相 比具有运算量少、性能可靠 的特 点,但在大字汇表语音识别中,运算量与存贮量仍然很大,难 以在微机上低成本实现。 在算法上也存在与汉语语音特征不相符 合的地方。 1.1.1 VQ/HMM 方法 中的 VQ 码本是一种全局码本,不能反应每个 具体 单 音 节 的特征,仅用来产生 VQ 标号序列,VQ 不仅是一种有效的数据压缩方法 ,也是一种 有效的识别方法,然而在这个算法 中却没有充分利用 VQ 的识别作用。 1.1.2 HMM 识别方法只是对一个 VQ 标号序列进行匹配,不同音有可能产生相似标 号序列,因此,HMM 可能混淆明显不同的音。非特定人的 10个数 字识 口实验 中, 2与8就是一个容易混淆的例子。 1.1.5 HMM 是一种全局距离识别方法 ,一 个 汉 语 音节约 4o~7o 帧 (1okHz 采 样,帧移 lOms)而其辅音部分长度在 3~6帧左右,在全局距离的计算中,辅音的影 响被削弱,因此 1与 7 (yi,

文档评论(0)

2017meng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档