- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于HMM的满文文本识别后处理的研究-计算机应用技术专业论文
东北大学硕士学位论文
东北大学硕士学位论文 摘要
摘 要
本文讨论了脱机手写体满文文本识别后处理系统的设计和实现,其中采用了 在文本识别后处理中应用最广泛的技术,即基于隐马尔可夫模型(HMM)的后处 理和基于词匹配的后处理方法。
论文首先叙述了少数民族语言信息化的现状及满文识别后处理的意义和必 要性。从总体上描述了满文文本识别系统的结构和后处理在整个识别系统中的作 用。然后,列举了在文本识别后处理过程中应用的比较成熟的和正在探索的一些 方法。主要包括:基于词匹配的文本识别后处理、基于句法一语义的文本识别后 处理、基于人工神经网络的文本识别后处理、基于统计方法的文本识别后处理。 并且在讨论基于统计的文字识别的后处理时,着重的讨论了隐马尔可夫模型 (HMM)在脱机手写体满文文本识别后处理中的基本思想和方法。在采用隐马尔 可夫模型(HMM)进行文本识别后处理时,提出了一种有效估算单字识别的结果 可信度(即单宇识别置信度)的方法,准确的估算单字识别结果对进一步进行识别 后处理具有重要的意义。接着对影响后处理的几个重要因素:语料库的规模,语 料的选取,数据平滑做了重点讨论。
在讨论词匹配的后处理方法时,首先分析统计方法的不足:统计语言模型仅 仅考虑了语言的上下文关系,但不考率任何的语法和语义关系。在实现中假定一 个满语的语句是一个一阶或二阶马尔可夫链,这样实现简化的假设使发生错误的 概率进一步增大。事实上,马尔可夫链只对非单词词组有较好的连接的关系。转 移概率本身是由训练语料库决定,与实际文本有一定的偏差。然后介绍了词匹配 方法的思想,最后提出词匹配法和隐马尔可夫模型(HMM)相结合的方法。两种 方法的结合大大的提高了满文识别系统的识别率。最后对以后的工作提出了设 想。
本文讨论的方法已应用在脱机手写体满文文本识别系统中,经过后处理模块 的处理后,系统的识别率有一定的提高。但是,后处理模块发挥的好坏与单字识 别模块的识别率有密切的关系,也就是说,较高的单字识别的识别率是后处理发 挥良好作用的前提。
关键词:满文,后处理,霞信度。聚类分析,隐马尔可夫模型
东北大学硕士学位论文
东北大学硕士学位论文 ABSTRACT
Abstract
The thesis presents the design and implementation of off-line handwritten Manchu document recognition system.The system adopts the most widely used technique in document recognition postprocessing,namely,the postprocessing
method based on Hidden Markov Model(HMM)and WOrd-match.
First,the thesis describes the actuality of the modernization ofminority language
information and the significance and necessity of Manchu document recognition.It presents the framework of Manchu recognition system and the function of postprocessing in the whole recognition system.Second,the thesis enumerates some
effective and exploratory methods in document recognition postprocessing,The methods include postprocessing based on word—match,on syntax and semantics,on Artificial Neural Network,and on statistical linguistics,When discussing the methods of document recognition based on statistical linguistics,the thesis emphasizes the basic theory and methods of off-line Manchu document recognition ba
您可能关注的文档
- 基于HHT的故障诊断时频分析-通信与信息系统专业论文.docx
- 基于HHT的电能质量分析仪的研究-电气工程专业论文.docx
- 基于HHT的电力系统低频振荡在线分析研究与实现-检测技术与自动化装置专业论文.docx
- 基于HHT的电力系统低频振荡监测分析的研究-控制工程专业论文.docx
- 基于HHT的水泥混凝土路面脱空检测的试验模态分析研究-交通运输工程专业论文.docx
- 基于HHT的语音情感识别分析-物理电子学专业论文.docx
- 基于HHT的非平稳信号特征提取方法及应用研究-控制科学与工程专业论文.docx
- 基于HHT的语音情感识别技术研究-计算机科学与技术专业论文.docx
- 基于HI3515开发板的视频监控系统设计-电子与通信工程专业论文.docx
- 基于HHT的磁控自动焊接系统的研究-机械工程专业论文.docx
- 基于HMM的汉语连续数字语音识别-信号与信息处理专业论文.docx
- 基于HMM的在线手写签名认证算法研究-电路与系统专业论文.docx
- 基于HMM的轴承故障音频诊断方法研究-计算机应用技术专业论文.docx
- 基于HMM的脱机自由手写英文单词识别系统-模式识别与智能系统专业论文.docx
- 基于HMP技术的媒体服务器的设计与实现-计算机应用与技术专业论文.docx
- 基于HMM的网络隐蔽信道检测模型的研究-计算机应用技术专业论文.docx
- 基于HOCTPN的制造系统建模仿真技术与应用研究-机械电子工程专业论文.docx
- 基于HMP技术的企业级电话会议系统的研究与实现-计算机应用技术专业论文.docx
- 基于HMM算法的仿人机器人语音识别技术的研究-计算机科学与技术专业论文.docx
- 基于HMM的语音识别技术的研究-计算机应用技术专业论文.docx
文档评论(0)