- 3
- 0
- 约5.22千字
- 约 4页
- 2017-08-10 发布于安徽
- 举报
6—57
利用语言知识的汉字识别分类策略
方应谦曹守建 牛 光
(郑州电子技术学院二系450004)
摘要本文分析丁单字分类的缺点.给出了以多字词及短语为分类的基本单位,利用Markov模型、语
言的多种统计知识及距离测度,进行分类的策略与方法。较好地克服了过去以单字为分类的基本单位
造成的识别率较低、识别速度较慢的缺点。
关薯调汉字识别语言知识分类
1 引 言
长期以来,汉字识别中的分类都是以汉语中的字作为基本单位,称作字分类。字分类的目的是
产生每个待识字的候选字集合.然后将此候选字集合送识别级进行细识别。这种识别系统称为单
字识别,单字识别是印刷体汉字或手写体汉字识别系统中普遍采用的策略。由于单字识别的能力
有限…12】,为了补救识别中产生的错误,通常都在后处理中利用了一些语言知识进行纠错。从本
质上讲,这种利用语言知识的纠错【3卜bJ。仍是建立在单字识别基础上的,受单字识
您可能关注的文档
最近下载
- 2026住院医师规培-福建-福建住院医师规培(口腔科)历年参考题库含答案详解5卷试题.docx VIP
- 湖北省事业单位工勤技能考试备考题库真题.pdf
- 增强现实(AR)技术在博物馆古籍展示中的叙事设计_2.docx VIP
- AI Agent产品需求文档(PRD)编写指南.docx VIP
- 乙肝丙肝预防培训课件.ppt VIP
- 《民法典》中保证合同的从属性规则解析.docx VIP
- 梅毒预防知识讲座讲课PPT.pptx VIP
- GB 50870-2013 建筑施工安全技术统一规范.docx
- 2025年广东汕头市中考政治真题试题(含答案).docx VIP
- 2024惟泰VT300气体报警控制器快速操作指南.docx VIP
原创力文档

文档评论(0)