印刷体数学公式的结构分析与识别-计算机工程与应用.PDF

印刷体数学公式的结构分析与识别-计算机工程与应用.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
印刷体数学公式的结构分析与识别-计算机工程与应用

196 2015 ,51(9 ) Computer Engineering and Applications 计算机工程与应用 印刷体数学公式的结构分析与识别 宗亚辉,李双庆 ZONG Yahui, LI Shuangqing 重庆大学 计算机学院,重庆 400044 College of Computer Science, Chongqing University, Chongqing 400044, China ZONG Yahui, LI Shuangqing. Structure analysis and recognition of printed mathematical expressions. Computer Engineering and Applications, 2015, 51 (9 ):196-200. Abstract :A method of structural analysis of mathematical expressions which connects the method of top-down with the way of bottom-up is put forward according to the issue of the printed mathematical expression recognition. Specific struc- tures with root expressions, matrix expressions, superscript or subscript expressions are analyzed in a bottom-up way. Structures which have horizontal or vertical relations are analyzed using up-bottom way. This procedure is applied first to the whole region of the expression and then it is applied to each divided sub-expression region, recursively. The structure of a recognized expression is represented by a tree structure. Experiment results prove that this strategy gets higher accuracy for the structural analysis of mathematical expressions. Key words :structural analysis; mathematical expressions; top-down; bottom-up 摘 要:针对印刷体数学公式中的结构分析,提出将“自下而上”和“自上而下”相结合的策略。自上而下是针对特殊 结构的分析,特殊结构包括根号、矩阵、上下标等。自上而下是对公式整体结构的分析,并且用递归的方式对各个子 表达式采用同样的分析方法。结构分析成功后,用树形结构表示整个公式的二维空间布局。实验结果表明,此种分 析策略有效地提高了印刷体数学公式的结构分析成功率。 关键词:结构分析;数学公式;自上而下;自下而上 文献标志码:A 中图分类号:TP393 doi :10.3778/j.issn. 1002-8331.1305-0486 1 引言 数学公式。Chang[6]提出利用结构说明方案分析数学公 随着计算机应用和网络技术的快速发展,科技文档 式的方法,主要利用操作码的优先级和它的操作数范 的应用越来越普遍。科技文档不仅包括文字、图像和表 围,虽然考虑了效率,但该算法冗长,难于理解和实现。 格,还包括大量的数学公式。虽然OCR[1] (Optical Char- 本文通过对以上方法的分析,针对这些结构分析方 acter Recognition ,光学字符识别)系统对科技文档中的 法存在的问题,根据公式中字符的结构布局,提出一种 文字部分有很高的识别率,但却无法识别其中的数学公

您可能关注的文档

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档