- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种汉语单音节基音提取与声调识别方法
清 华 大 学 学 报 (自 然 科 学 版)
JOURNAL OF TSINGHUA UNIVERSITY Voi30No.41990
第 30卷 第 4期 .
一 种新型汉语单音节识别方法
电子工程系 曹 洪
摘 要 :介绍 了一种新型字基 VQ/HMM 语音识别方法tVQ 与 HMM 分级识别算法
使得 VQ部分可用作语音识别的第一级处理 HMM部分作第=级识别。在第一级识别 中
可弓l进汉语的音素知识,使 VQ/HMM性能进一步提高,并可用于大字 表的实时语音识
别.存贮量、计算量均大大碱少。用此方法把汉语四声作一个 HMM 模型,使汉语 400
个基本音节的识别率达 96% 以上,若加上精确冯声识别剐可识别汉语的 1200种声音
关键词;语音识别。音节 .矢量量化,臆含马可夫模型
0 引 言
目前汉字信息的计算机输入是一项十分复杂的工作 ,它不仅需要用户经过训练,记
忆才能掌握,而且效率低 。汉字信息的计算机输入 问题是中文信息处理的一个难题,我
们试图借助语音识别技木研制一种经济、实用的语音识别卡,使它代替键盘,用声音向
计算机输入汉字信息,为此,研制了一种在 IBM-PC 系列机 上实 现 的语 音 卡,它
能识别汉语所有的 400单音节。汉语仅有 400个基本音节,若考虑四声 发音,仅 有
1200个发音。CCDOS 中的 8O00多个汉字具有许多同音字,因此仍用 CCDOS 中
二次输入的方式,使用户可在若干候选的同音字中选择正确的字,这样可解除对用户的
调练和记忆要求,而使计算机 中文信息处理系统能被更广泛的用户所接受。使用上述方
法的声控 中文打字机,在办公室 自动化中将获得更广泛的应用。语音识别卡采用了一种
新型的特定人的语音识别方法,这种在 VQ/HMM 方法的基础上改造的新算法以96
以上的识别率识别汉语的 400个单音节,从而使语音输入方法与 CCDOS现有的拼音
输入方式兼容。经典的 VQ/HMM 方法… 是一种有效的非特定人的识 别 方 法,实
际上一个人的发音本身也是复杂多变的,VQ/HMM 方法是一种适应性好的统计模 式
识别方法,它能较好地反映某种语声的不变特征,性 能稳 定,与传统 DTW 方法相
比,VQ/HMM 具有更可靠的实用价值。采用 VQ/HMM 方法,IBM 公司研制了一
种 2000o字的语音识别系统 (Tangora一20)[2,31 用于办公室 自动 化 系 统 。基 于
VQ/HMM 的特点和 IBM 公司这一成功的应用,我们在此基础上研究了一种更 为有
效、系统实现大大简化的字基 VQ/HMM 方法:VQ 与 HMM 分级识剐方法。它能
本文于 1989年 4月 3 日收到
清 华 太 学 学 报 第 30卷
在 PC 微机上 以较高性能价格 比实现汉语的计算机输入。
1 VQ 与 HMM 分级识别算法原理
1.1 经典 VQ /HMM 分析
经典的 VQ/HMM 方法与传统 的 DTW 方法相 比具有运算量少、性能可靠 的特
点,但在大字汇表语音识别中,运算量与存贮量仍然很大,难 以在微机上低成本实现。
在算法上也存在与汉语语音特征不相符 合的地方。
1.1.1 VQ/HMM 方法 中的 VQ 码本是一种全局码本,不能反应每个 具体 单 音 节
的特征,仅用来产生 VQ 标号序列,VQ 不仅是一种有效的数据压缩方法 ,也是一种
有效的识别方法,然而在这个算法 中却没有充分利用 VQ 的识别作用。
1.1.2 HMM 识别方法只是对一个 VQ 标号序列进行匹配,不同音有可能产生相似标
号序列,因此,HMM 可能混淆明显不同的音。非特定人的 10个数 字识 口实验 中,
2与8就是一个容易混淆的例子。
1.1.5 HMM 是一种全局距离识别方法 ,一 个 汉 语 音节约 4o~7o 帧 (1okHz 采
样,帧移 lOms)而其辅音部分长度在 3~6帧左右,在全局距离的计算中,辅音的影
响被削弱,因此 1与 7 (yi,
您可能关注的文档
- XXXX交易所经营问题与对策探讨 本科毕业设计.pdf
- XXXX区中小学教育乱收费治理对策研究.pdf
- xxx服饰(上海)有限公司的战略分析.pdf
- Xxx电台广告管理系统V3.0系统分析.pdf
- xxx电台音响资料管理系统.pdf
- XXX电集团在华东地区物流改善案的探讨 物流师论文.pdf
- xxx通讯有限公司内部控制存在的问题及其完善 论文.pdf
- xxx通讯有限公司内部控制存在的问题及其完善 外文.pdf
- xxx通讯有限公司内部控制存在的问题及其完善 开题报告.pdf
- XXX餐饮业老字号现状与发展对策研究分析 .pdf
- 职业学院金山湾产教融合示范项目可行性研究报告申请报告.doc
- 职业教育智能实训设施提升可行性研究报告申请建议书YYY.doc
- 富士施乐Apeos C7071_C6571_C5571_C4571_C3571_C3071参考指南操作篇.pdf
- 富士施乐Apeos4620SDF使用说明书用户指南.pdf
- 富士施乐AC7071_C6571_C5571_C4571_C3571_C3071参考指南附录篇.pdf
- 富士施乐AC7071_C6571_C5571_C4571_C3571_C3071参考指南选装装置篇.pdf
- 人工智能科技主题高端简约模板88.pptx
- 人工智能科技主题高端简约模板14.pptx
- 人工智能科技主题高端简约模板55.pptx
- 人工智能科技主题高端简约模板119.pptx
最近下载
- 上海夜间经济的发展特征、存在的主要问题及相关政策建议.docx VIP
- 2万吨年饲料级磷酸脲技改配套生产1万吨年聚磷酸铵环境影响报告书.pdf VIP
- 矿山绩效考核方案.doc VIP
- 2023全国职业教育教师现状调研报告 .pdf VIP
- 昆明市市政排水管道和附属构筑物设计安装图集2013版.docx VIP
- GB 12158-2024防止静电事故通用要求深度解读.pptx VIP
- 点燃艺术的创造火花-引导孩子释放无限艺术潜力.pptx VIP
- YAMAHA MG16_6fx中文说明书.pdf VIP
- 2024国家能源集团新疆哈密能源化工有限公司社会招聘110人笔试参考题库附带答案详解.doc
- 药学专业知识课件.pptx VIP
文档评论(0)