脱机印刷体彝族文字识别系统的原理与实现.pdfVIP

  • 5
  • 0
  • 约1.6万字
  • 约 5页
  • 2017-08-16 发布于北京
  • 举报

脱机印刷体彝族文字识别系统的原理与实现.pdf

第22卷 第2期 计 算机 技 术 与 发 展 Vo1.22 No.2 2012年2月 COMPUTER TECHNOL0GY AND DEVELOPMENT Feb. 2012 脱机印刷体彝族文字识别系统的原理与实现 朱宗晓 ,吴显礼 ’ (1.中南民族大学计算机科学学院 少数民族语言文字信息处理实验室,湖北 武汉430074; 2.中科院 自动化所,北京 100086) 摘 要 :脱机印刷体彝文文字识别系统包括字符分割、特征提取、特征压缩以及字典匹配 四个主要模块 ,该系统利用总结 出的彝文字符合并和反合并规则提高了字符分割准确率 ,采用 1024维周边方 向贡献度作为彝文字符统计特征,对彝文中 存在的大量相似字符具有 良好的区分能力 。系统还采用基于KL变换的特征压缩算法和三级字典快速匹配算法 ,最终实 现了一个基于Windows平台的脱机印刷体彝文识别平台,该平台对样本的一次识别率在99.4%以上。实验结果表明这些 方法是可行的和高效的。 关键词:彝文识别;字符分割 ;周边方向贡献度 ;特征压缩;字典匹配 中图分类号:TP391 文献标识码:A 文章编号:1673-629X(2012)02-0085-04 PrinciplesandImplementationofanOff-LinePrintedYi CharacterRecognitionSystem ZHU Zong—xiao .w u Xian—li, (1.InofrmationProcessingLabforMinorityLanguage,CortegeofComputerScience,South-Central UniversityofrNationalities,Wuhan430074,China; 2.InstituteofAutomation,ChineseAcademyofScience,Beijing100086,China) Abstract:Theoff-lineprintedYicharacterrecognitionsystem consistsoffourmainmodules,includingcharactersegmentation,feature extraction,featurecompressinganddictionarymatching.Inthissystem ,Yicharacters’mergerrulesnadnati-mergerrolesalesumma- rizedtOincreasetheaccuracyofcharactersegmenattion;1024dimensionalfeaturesofperipheraldircetioncontributionareusedassatffs— cal characteristicsofYicharacterwim gooddiscriminationbetweenalragenumbersofYisimi lra chraacters.Featurecompressingalgo— rithm basedonKarhunen-Lo~vetransformationandthree-leveldictionary-matching algorithm isalso adoptedto realizena off—line printedYicharacterrecognitionsystem basedonW indows.Itsfnstrecognitionratesofsamplesareabove99.4% .whichpmvde htatan arithmeticusedinthissystem are feasiblenadeffici

文档评论(0)

1亿VIP精品文档

相关文档