- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中 文 信 息 学 报
第 13 卷 第 4 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 13 No. 4
基于 HMM 的汉语文本识别后处理研究
李元祥 丁晓青 刘长松
清华大学电子工程系 北京 100084
摘要 本文用 HMM ( Hidden Markov Model) 描述汉语文本识别后处理 ,将汉语语言和单
字识别这两个概率模型结合起来 , 以充分利用单字识别器提供的信息 。语言模型的参数由语
料库统计得到 ;单字识别模型的参数为条件概率 ,经理论分析 ,它可转化为后验概率来求解 。
在分析训练样本集单字识别结果的基础上 , 提 出一种统计方法估计候选字 的后验概率 。
HMM 在脱机手写体汉语文本识别中的实验表明 ,后处理性能除取决于语言模型外 ,还取决于
后验概率的精确估计 。
关键词 汉字识别 后处理 语言模型 隐马尔可夫模型 后验概率
Postprocessing Study of Chinese Document
Recognition Based on HMM
Li Yuanxiang Ding Xiaoqing Liu Changsong
Dep art ment of Elect ronic Engineering Tsinghua U niver sit y Beij ing 100084
Email : lyx @ocr serv . ee . t singhua . edu . cn
Abstract In t his p aper , a po stp rocessing met hod using HMM ( Hidden Markov Model) for Chi
nese document recognition is p ropo sed . HMM combines language model wit h single character
recognition ( SCR) model to make t he best of SCR outp ut . The p arameter s of language model are
derived from corp us , while t he p arameter s of SCR model are conditional p robabilities t hat can be
converted into po sterior p robabilities by t heoretic analysis. On t he basis of SCR outp ut analysis ,
po sterior p robabilities of candidates are obt ained by st atistical met hod . Experiment s in off - line
Chinese document recognition show t hat po st - p rocessing performance depends on efficient evalu
ation of po sterior p robability , besides p roper language model .
Key words Chinese Character Recognition Po stp rocessing Ngram L anguage Model Hidden
Markov Model Po sterior Probability
本文系“全国中文信息学术交流暨工作会议”推荐的优秀论文
(
您可能关注的文档
- 在制作真核细胞维结构模型时,提供给你制作细胞膜的三种.ppt
- 在本课中,作为我们展示了一个怎样的曹操形象.ppt
- 在沃尔玛的超市里天天低价是其最醒目的标签,但只是.PDF
- 在生产和生活中进调查统计、分析比较时,经常要用到百分.ppt
- 在阳台种盆栽辣,几盆就足够全家吃个把月.pdf
- 地,即为运动常数地完全集).PDF
- 地图版高中信息科新教材分析.ppt
- 地方政府地土地财政及其可持续性研究.PDF
- 地面上的水被阳晒着的时候,吸收了热,变成了水蒸气。.ppt
- 均胜集团国家级士后工作站招聘博士.doc
- 水利工程防灾减灾措施方案(3篇).docx
- 头雁竞飞工程实施方案(3篇).docx
- 机械工程_战略规划方案(3篇).docx
- 各类监控工程施工方案(3篇).docx
- 2025年深圳市规划和自然资源局光明管理局第二批一般特聘岗位招聘笔试备考试题含答案详解(研优卷).docx
- 2025山东大学晶体材料研究院非事业编制人员招聘1人模拟试卷及参考答案详解一套.docx
- 2025山东泰安市农业科学院招聘博士研究生2人笔试备考试题附答案详解(完整版).docx
- 2025年怀化市辰溪县市场监督管理局招募见习生(5人)考前自测高频考点模拟试题及答案详解(真题汇编).docx
- 2025年兴业银行呼和浩特分行“雏雁计划” 暑期实习生模拟试卷含答案详解(实用).docx
- 2025年宜昌市猇亭区招聘化工园区专职工作人员(6人)模拟试卷完整答案详解.docx
最近下载
- 北京市海淀区七年级第一学期期末统考地理试卷-初一地理试卷与试题.pdf VIP
- 西南18J312-楼地面-踢脚-变形缝-涂料构造.pdf VIP
- 国际私法【机考真题】-0069.pdf
- 旋塞阀装配图的画图步骤抄画下图所示旋塞阀的装配图课件.pptx VIP
- 优秀传统文化进幼儿园的实践性研究开题、中期、结题报告.pptx VIP
- 2023年烟草公司半结构化面试实例及解析(一).pdf VIP
- 2023年湖南省长沙市(初三学业水平考试)中考物理真题试卷含详解.docx VIP
- 业务连续性管理实施指南.docx VIP
- 《民族大团结》ppt课件.pptx
- 2025至2030年中国粉煤灰综合利用行业发展趋势及投资前景预测报告.docx
文档评论(0)