手写数学符号的基元识别方法.PDF

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
手写数学符号的基元识别方法

1998年3月 重庆大学学报 (自然科学版) Vol,21,№,2 第21卷第2期 Journal of Chongqing University(Natural Science Edit Eon) Mar.1998 手写数学符号的基元识别方法 赵 学军 余楚 中 杨 波 潘保 昌 TP砰/’ (重蘸妥辜 ;: 实 吾 _口044I第一作者3l萝,男.讲师,博士生) 摘 要 对手写数学字符的联机识别进行了研究。首先分析94个常用数学符号的结 构,指出这些符号均由10个基本结构元组成;其次抽取数学符号的三个重要特征:基元矢 量、基元之问的位置关系和基元长度矢量并采用了一种基元排序法。同时考虑匹配值和不匹 配值以及增加几何约束改进了传统的动态规划匹配方法,并用改进的Kuhn--Ivlunkres算法 求最佳匹配。在对2o人无限制书写的数学符号的识别试验中,正确识别率为92. ,误识 率为3.03 ,拒识率为4.45 . 关键词一i 剐 墼兰笪呈!壁堑握豇;童!! 中国图书资料分类法分类号 TP391.4 饥 0 引 言 由于计算机技术的高速发展,人们可以快速处理大量的数据,如对大量信息的存储、查 询、统计等。但数据的输入速度远远低于数据处理的速度,这大大妨碍了人们对计算机的使 用。为了解决数据的输入问题,人们作了长期的积极的努力,提出了许多方法 ],如各种基 于键盘的输入方法,但在拟定一份稿子时,为了集中注意力完成稿子的制作,人们常常喜欢 用笔和纸书写而不采用键盘,因为用键盘输入会打断正在进行的思维 所以许多人致力于笔 输入方法的研究。十多年来,已经提出了大量的研究报告,也已开发出能识别机械打印字符、 书写印刷体字符和联机手写字符等多种系统。虽然在有些领域如自由手写体字符的识别并 不尽人意。在脱机识别西文印刷体、手写体字符,联机识别西文字符,脱机联机识别印刷体、 手写体汉字等领域都在积极的研究和探索[|~,已经或不久将会有优秀的识别系统在市面 上流行。 但对自然科学工作者,特别是数学工作者来说,这些发展和成就都似乎与他们的关系不 大,因为这些系统并不能解决或完全解决他们的数据输入问题。他们中不少人仍然使用手写 文稿进行交流,原因是没有好的自然的数学表达式的快速输入系统。目前能输人数学表达式 的系统全部采用键盘输入,不仅需要长时间的学习、记大量的控制命令,而且输入速度慢·这 些系统并不受他们的欢迎。他们盼望优秀的数学表达式的笔输入系统问世。 我们对数学表达式中可能出现的字符进行了分类,第一类为阿拉伯数字、英文大小写字 母及几个使用频率很高的希腊小写字母和数学符号;第二类为希腊大小写字母;第三类为数 收文日期 1997-02-25 118 重庆大学学报 (自然科学版) 学符号 本文就第三类字符的联机识别进行研究。 第三类包含如下字符: . , ....;…;,.,. ④@f 毋 o。。c △~ 竺fⅡⅢ∈ c 3 U n 一 (){)+一士千÷一≤≮≥≯一≠一 0 一一一 甘卜 上×/、/\V^V】 I II//十‘{n O[] 1 字符结构 通过对52人随意写出的620X94个字符的分析得知,这94个字符在一般自由手写体 中由下列基率结构元构成: 一 I()u一0/\· 依次编号为O…I 2 3…4 5 6、7、8、9,称为基元代码。 2 特征抽取 2.1 基元矢量 先对输入字符进行预处理,包括触点连续化、字符点阵规范化。然后对坐标点进行顺序 跟踪,提取基本(结构)元,按书写顺序得到字符的基元矢量,如 士”的基元依次为“一 、 I”、 “ 一 ,基元码依次为0、I、o,从而基元矢量为(O,I,O).由于不同的人的书写习惯不同,字符 f “士 的基元矢量的元素的顺序可能不同,可能为(o,o,I)、(1,0,o)等。而积分号 的基元 矢量可能为(8,I,9)、(8

文档评论(0)

ldj215323 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档