- 16
- 0
- 约1.73万字
- 约 4页
- 2017-08-11 发布于北京
- 举报
第25卷第11期 计算机应用与软件 V0l_25No.11
2008年 11月 ComputerApplicationsandSoftware NOV.2008
Postscript格式科技文献中数学表达式的提取方法
张志伟 孔凡让 吴 欣
(中国科学技术大学精密机械与精密仪器系 安徽 合肥 230027)
(南京理工大学机械工程学院 江苏 南京210094)
摘 要 从Postscript格式的科技文献中提取识别数学表达式,是数学表达式识别领域的一个新的研究方向。主要针对以Word
和Latex为生成源的Ps文档 ,提出了基于内容的数学表达式提取方法。首先重载了PS语言中的一些相关命令,以提取Ps文档中的
字符与线段信息;之后根据字符名称、字体、位置等信息对字符进行分析,同时连接线段并加以识别,从而提取出数学符号;最后,根
据符号间的空间位置关系和启发式规则
原创力文档

文档评论(0)