- 5
- 0
- 约1.6万字
- 约 5页
- 2017-08-16 发布于北京
- 举报
第22卷 第2期 计 算机 技 术 与 发 展 Vo1.22 No.2
2012年2月 COMPUTER TECHNOL0GY AND DEVELOPMENT Feb. 2012
脱机印刷体彝族文字识别系统的原理与实现
朱宗晓 ,吴显礼 ’
(1.中南民族大学计算机科学学院 少数民族语言文字信息处理实验室,湖北 武汉430074;
2.中科院 自动化所,北京 100086)
摘 要 :脱机印刷体彝文文字识别系统包括字符分割、特征提取、特征压缩以及字典匹配 四个主要模块 ,该系统利用总结
出的彝文字符合并和反合并规则提高了字符分割准确率 ,采用 1024维周边方 向贡献度作为彝文字符统计特征,对彝文中
存在的大量相似字符具有 良好的区分能力 。系统还采用基于KL变换的特征压缩算法和三级字典快速匹配算法 ,最终实
现了一个基于Windows平台的脱机印刷体彝文识别平台,该平台对样本的一次识别率在99.4%以上。实验结果表明这些
方法是可行的和高效的。
关键词:彝文识别;字符分割 ;周边方向贡献度 ;特征压缩;字典匹配
中图分类号:TP391 文献标识码:A 文章编号:1673-629X(2012)02-0085-04
PrinciplesandImplementationofanOff-LinePrintedYi
CharacterRecognitionSystem
ZHU Zong—xiao .w u Xian—li,
(1.InofrmationProcessingLabforMinorityLanguage,CortegeofComputerScience,South-Central
UniversityofrNationalities,Wuhan430074,China;
2.InstituteofAutomation,ChineseAcademyofScience,Beijing100086,China)
Abstract:Theoff-lineprintedYicharacterrecognitionsystem consistsoffourmainmodules,includingcharactersegmentation,feature
extraction,featurecompressinganddictionarymatching.Inthissystem ,Yicharacters’mergerrulesnadnati-mergerrolesalesumma-
rizedtOincreasetheaccuracyofcharactersegmenattion;1024dimensionalfeaturesofperipheraldircetioncontributionareusedassatffs—
cal characteristicsofYicharacterwim gooddiscriminationbetweenalragenumbersofYisimi lra chraacters.Featurecompressingalgo—
rithm basedonKarhunen-Lo~vetransformationandthree-leveldictionary-matching algorithm isalso adoptedto realizena off—line
printedYicharacterrecognitionsystem basedonW indows.Itsfnstrecognitionratesofsamplesareabove99.4% .whichpmvde htatan
arithmeticusedinthissystem are feasiblenadeffici
原创力文档

文档评论(0)