- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学公式提取.ppt
从Postscript格式文献中提取数学公式的方法;概述;PS语言;PS和PDF文档的生成和转化;PS语言特点; 的文件组织结构。头文件中主要包含脚本中命令和过程的定义。
PS语言由解释器进行解释执行,控制打印机或显示设备进行输出。;PS中文本的显示机制;PS显示文本的过程;数学符号提取; 此外, 一些数学符号不是由字符而是由图形所表示的。
例如在以Word文档为生成源的PS文档中, 根号表示为4 条顺次连接的线段。
在由Latex文档转换得到的 文档中, 根号表示为由4 条线段封闭连接形成的狭长矩形。因此, 除了提取字符, 还需要提取出这些表示特殊数学符号的图形。;字符提取;具体步骤:
(1)重载show ashow w idthshow awidthshow kshow xshow yshow xyshow等显示命令, 提取出字符串;
(2)加载当前字体词典, 访问其字体类型和字体名称;
(3)根据每个字符的字符编码, 在字体词典的编码 表中索引对应的字符名称;
(4)对每一个字符, 根据显示命令的位置参量,设置正确的当前位置, 并用charpath命令得到其应字形的图形构造路径, 之后用 pathbbox命令得到字形的最小外接矩形;
(5)对外接矩形坐标进行坐标变换, 由PS用户坐标变换至最终显示的页面坐标, 从而得到字符的
位置信息。;图形提取;数学符号识别; 对于提取出的图形,先对其进行编码,然后根据编码识别其对应的数学符号。首先给出一个绘制方向的定义:对开放的图形,即折线段,规定起点为折线段两端点中x坐标较小者(x坐标相等时,取y坐标较大者),另一端点则为重点,沿各点段由起点到终点的行进方向为绘制方向;对封闭的图形,起点选择为各端点中x坐标最小者,规定绘制方向为由起点以顺时针沿各线段行进,最后回到起点的方向。
规定了绘制方向后,以下图所示的八方向编码依次对图形中各线段进行标记,这样可以得到整个图形的编码。;;数学公式提取;给出一个简单的文法G={N,∑,P,S},并根据这个文法合并所有识别出的数学符号。其中,非终结符N={S},并根据这个文法合并所有识别出的数学符号。其中,非终结符N={S},终结符∑为数学符号结合,S为起始符,也是唯一的非终结符,表示数学公式,产生式P定义为以下的启发式规则???
规则1 数学重音符号 数学符号与其上面的数学重音符号合并。
规则2 上下标 数学符号与其上下标位置的数学符号合并。;规则3 单元运算符 单元运算符与其相邻的数学符号合并。
规则4 二元运算符 “+”等二元运算符与其前后子公式合并。
规则5 关系运算符 “=”等关系运算符与其前后子公式合并。
规则6 分式 当“/”前后为子公式时,将“/”作为斜分号,并将其作为前后子公式合并为分式。当“-”上下为子公式时,将“-”作为水平分毫,将其与上下子公式合并为分式。;规则7 根式 根号范围内的子公式与根号合并为根式。
规则8 积分与求和 积分符号与其上下限及积分项合并;求和符号与其上下限及求和项合并。
规则9 函数 数学函数名与其作用域子公式合并。
规则10 定界符 由“(”“)”等定界符包围的子公式与定界符合并。
规则11 矩阵 矩阵等在空间阵列排列的子公式按空间位置关系进行合并。
规则12 公式扩展 水平相邻的子公式相合并。e.g:100,xyz。
文档评论(0)