碎纸复原算法.pdfVIP

  • 94
  • 0
  • 约7.57千字
  • 约 7页
  • 2017-08-14 发布于天津
  • 举报
碎纸复原算法.pdf

第卷 增刊 工 程 数 学 学 报 年月 文章编号 碎纸复原模型与算法 陈佳润 谢天旺 王行志 指导教师 胡桂武 广东财经大学,广州 编者按 该论文将一维碎纸复原文体归结为旅行商问题,利用模拟退火法进行求解,无需人工干预得到了正确的复原 结果.对于二维复原文体,通过提取文字的层次特征,按行分类,将其转化为一维碎纸问题加以解决.不足 之处是旅行商问题的数学描述太过简单,用模拟退火法求解,收敛较慢. 摘 要 本文旨在研究碎纸的文字及层次特征,以此建立复原的模型及算法,以对其进行复原.针对问题一,通过碎 纸的文字特征,建立了一维碎纸复原模型,将复原问题转化为旅行商问题,并利用模拟退火法进行求解,实 现了一维碎纸的复原;针对问题二,通过碎纸的层次特征,建立了二维碎纸复原模型,即将碎纸进行分类, 转为多个一维复原问题并进行求解,实现了二维碎纸的复原.最后,本文提出最小干预度算法,实现了对算 法优劣的量化评价. 关键词 碎纸复原算法; ;模拟退火法;分类降维; 设计 分类号 中图分类号 文献标识码 基基基本本本假假假设设设 假设文字方向是水平的,以保证问题一中识别序列的有效性,与实际中大多数情况相符. 问问问题题题分分分析析析 问题一是一维碎纸复原问题,首先提取图片的像素矩阵,并对其进行二值化处理,提 取出碎纸的文字特征,构造识别序列,进而定义了碎纸之间的距离,将碎纸复原问题转化 为 问题,利用模拟退火法进行求解;问题二是二维碎纸复原问题,首先根据碎纸的文字 间距、大小等提取其层次特征,结合 程序对其进行分类,将问题转化为一维问题进行求 解. 模模模型型型的的的建建建立立立与与与求求求解解解 一维碎纸复原模型 图像的预处理 首先将图片导入,得到对应的像素矩阵,由计算机图形学相关知识可知,空白位置 的像素值为,为了使像素矩阵特征更为明显,将其二值化,即    其他 其中 为二值化前的像素值, 为二值化后的像素值. 工 程 数 学 学 报 第卷 碎纸特征的提取 一般来说,碎纸特征的提取大致分为两类,一类是提取碎纸的轮廓,通过外形特征进行 拼接,如文献,另一类是通过提取碎纸上的文字特征,基于文字特征进行拼接,如文 献,根据题意,本文探讨的碎纸片外形皆为长方形,故属于第二类. 通过观察图 可以看出,碎纸可以提取出的特征有字符宽度、字距、上空、下空和行距 等,见图. 图 字符的特征 综上所述,文字特征的提取方式及步骤如下: 步骤 对图片进行二值化,文字为白色,空白为黑色; 步骤 找出图片所有行距、上空、下空 并标记其为灰色; 步骤 找出图片中所有的字距,并标记其为灰色; 步骤 通过行距、上空、下空、字距等特征计算出字符宽度. 根据题意,本文通过导入碎纸片图像的像素,并编写 程序对文字特征进行提取. 基于文字特征的识别序列 通过分析汉字与英文字母被分割的情况可以发现,对于每个被切割开的字符,如图 所 示,记字符的宽度为 ,被分割后的两部分宽度分别为 和,而对于没被切割的字符, 依旧保留宽度 .

文档评论(0)

1亿VIP精品文档

相关文档