Postscript格式科技文献中数学表达式的提取方法.pdfVIP

  • 16
  • 0
  • 约1.73万字
  • 约 4页
  • 2017-08-11 发布于北京
  • 举报

Postscript格式科技文献中数学表达式的提取方法.pdf

第25卷第11期 计算机应用与软件 V0l_25No.11 2008年 11月 ComputerApplicationsandSoftware NOV.2008 Postscript格式科技文献中数学表达式的提取方法 张志伟 孔凡让 吴 欣 (中国科学技术大学精密机械与精密仪器系 安徽 合肥 230027) (南京理工大学机械工程学院 江苏 南京210094) 摘 要 从Postscript格式的科技文献中提取识别数学表达式,是数学表达式识别领域的一个新的研究方向。主要针对以Word 和Latex为生成源的Ps文档 ,提出了基于内容的数学表达式提取方法。首先重载了PS语言中的一些相关命令,以提取Ps文档中的 字符与线段信息;之后根据字符名称、字体、位置等信息对字符进行分析,同时连接线段并加以识别,从而提取出数学符号;最后,根 据符号间的空间位置关系和启发式规则

文档评论(0)

1亿VIP精品文档

相关文档