基于单义域邻接图的工程图纸扫描图象的字符提取_0.docVIP

  • 3
  • 0
  • 约6.48千字
  • 约 14页
  • 2017-06-01 发布于浙江
  • 举报

基于单义域邻接图的工程图纸扫描图象的字符提取_0.doc

基于单义域邻接图的工程图纸扫描图象的字符提取_0

基于单义域邻接图的工程图纸扫描图象的字符提取 摘要 工程图纸扫描图象的图文分割是一个重要 问题 。本文在构建单义域邻接图基础上来提取字符及其特征。图文分离先从单义域中筛选字符笔划域,进行初步分离。然后,以字符笔划域为起点,遍历邻接图来搜索邻接字符笔划域,提取字符域, 分析 特性作进一步筛选。以字符域邻近与共线为判据来组合字符串域,字符域邻近是用其外接膨胀矩形相交来判定。利用共串字符域外接矩形中心及所附图形对字符域进行定向。对非水平字符域旋转至水平,并构建其单义域邻接图,以表达几何与拓扑特征,为后续识别作准备。实例表明,本算法可以较好地处理字符与图形的粘连问题,提取效果很好,且能够描述字符整体特征。 1 引言 工程图纸扫描图象的识别与理解是 目前 学术界和工程界 研究 的热点,在机械、 电子 、建筑及地理信息系统等 应用 领域中具有重要的实际意义。图样中有两部分信息,一是图形,由几何图素组成,用来表达产品形体;二是文字,用来定义产品尺寸及描述其它信息,有的附于图形,如尺寸数字等,也有独立存在的,如技术要求等。文字是图样中非常重要的信息。因此,工程图纸扫描图象的字符提取与识别是一个重要问题,对进一步的尺寸理解、图像理解等高层次理解都有较大作用。工程图样中的文字包括多种字符,如汉字、数字、字母及符号等。字符情况较为复杂,有自己的一些特点:字符多为手写,具有一定的随意性,不同于印刷体;具有

文档评论(0)

1亿VIP精品文档

相关文档