一种汉语单音节基音提取与声调识别方法.pdfVIP

下载本文档

3
0
约8.34千字
约 6页
2018-01-22 发布于贵州
举报
版权申诉

一种汉语单音节基音提取与声调识别方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

一种汉语单音节基音提取与声调识别方法

清华大学学报 (自然科学版) JOURNAL OF TSINGHUA UNIVERSITY Voi30No．41990 第 30卷第 4期．一种新型汉语单音节识别方法电子工程系曹洪摘要：介绍了一种新型字基 VQ／HMM 语音识别方法tVQ 与 HMM 分级识别算法使得 VQ部分可用作语音识别的第一级处理 HMM部分作第=级识别。在第一级识别中可弓l进汉语的音素知识，使 VQ／HMM性能进一步提高，并可用于大字表的实时语音识别．存贮量、计算量均大大碱少。用此方法把汉语四声作一个 HMM 模型，使汉语 400 个基本音节的识别率达 96％以上，若加上精确冯声识别剐可识别汉语的 1200种声音关键词；语音识别。音节．矢量量化，臆含马可夫模型 0 引言目前汉字信息的计算机输入是一项十分复杂的工作，它不仅需要用户经过训练，记忆才能掌握，而且效率低。汉字信息的计算机输入问题是中文信息处理的一个难题，我们试图借助语音识别技木研制一种经济、实用的语音识别卡，使它代替键盘，用声音向计算机输入汉字信息，为此，研制了一种在 IBM-PC 系列机上实现的语音卡，它能识别汉语所有的 400单音节。汉语仅有 400个基本音节，若考虑四声发音，仅有 1200个发音。CCDOS 中的 8O00多个汉字具有许多同音字，因此仍用 CCDOS 中二次输入的方式，使用户可在若干候选的同音字中选择正确的字，这样可解除对用户的调练和记忆要求，而使计算机中文信息处理系统能被更广泛的用户所接受。使用上述方法的声控中文打字机，在办公室自动化中将获得更广泛的应用。语音识别卡采用了一种新型的特定人的语音识别方法，这种在 VQ／HMM 方法的基础上改造的新算法以96 以上的识别率识别汉语的 400个单音节，从而使语音输入方法与 CCDOS现有的拼音输入方式兼容。经典的 VQ／HMM 方法… 是一种有效的非特定人的识别方法，实际上一个人的发音本身也是复杂多变的，VQ／HMM 方法是一种适应性好的统计模式识别方法，它能较好地反映某种语声的不变特征，性能稳定，与传统 DTW 方法相比，VQ／HMM 具有更可靠的实用价值。采用 VQ／HMM 方法，IBM 公司研制了一种 2000o字的语音识别系统 (Tangora一20)[2,31 用于办公室自动化系统。基于 VQ／HMM 的特点和 IBM 公司这一成功的应用，我们在此基础上研究了一种更为有效、系统实现大大简化的字基 VQ／HMM 方法：VQ 与 HMM 分级识剐方法。它能本文于 1989年 4月 3 日收到清华太学学报第 30卷在 PC 微机上以较高性能价格比实现汉语的计算机输入。 1 VQ 与 HMM 分级识别算法原理 1．1 经典 VQ ／HMM 分析经典的 VQ／HMM 方法与传统的 DTW 方法相比具有运算量少、性能可靠的特点，但在大字汇表语音识别中，运算量与存贮量仍然很大，难以在微机上低成本实现。在算法上也存在与汉语语音特征不相符合的地方。 1．1．1 VQ／HMM 方法中的 VQ 码本是一种全局码本，不能反应每个具体单音节的特征，仅用来产生 VQ 标号序列，VQ 不仅是一种有效的数据压缩方法，也是一种有效的识别方法，然而在这个算法中却没有充分利用 VQ 的识别作用。 1．1．2 HMM 识别方法只是对一个 VQ 标号序列进行匹配，不同音有可能产生相似标号序列，因此，HMM 可能混淆明显不同的音。非特定人的 10个数字识口实验中， 2与8就是一个容易混淆的例子。 1．1．5 HMM 是一种全局距离识别方法，一个汉语音节约 4o~7o 帧 (1okHz 采样，帧移 lOms)而其辅音部分长度在 3～6帧左右，在全局距离的计算中，辅音的影响被削弱，因此 1与 7 (yi，