汉字文档图像的图文分割方法研究-管理科学与工程专业论文.docxVIP

汉字文档图像的图文分割方法研究-管理科学与工程专业论文.docx

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
独 创 声 明 本人声明所呈交的学位论文是本人在导师指导下进行的研究工作及取得的研究成 果。据我所知,除了文中特别加以标注和致谢的地方外,论文中不包含其他人已经发表 或撰写过的研究成果,也不包含为获得 (注:如没有其他需要特别声 明的,本栏可空)或其他教育机构的学位或证书使用过的材料。与我一同工作的同志对 本研究所做的任何贡献均已在论文中作了明确的说明并表示谢意。 学位论文作者签名: 导师签字: 学位论文版权 使 用 授 权 书 本学位论文作者完全了解 学校 有关保留、使用学位论文的规定,有权保留并向 国家有关部门或机构送交论文的复印件和磁盘,允许论文被查阅和借阅。本人授权 学 校 可以将学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印 或扫描等复制手段保存、汇编学位论文。(保密的学位论文在解密后适用本授权书) 学位论文作者签名: 导师签字: 签字日期:2011 年 月 日 签字日期:2011 年 月 日 山东师范大学硕士学位论文 山东师范大学硕士学位论文 山东师范大学硕士学位论文 山东师范大学硕士学位论文 I I II II 目 录 摘 要 i ABSTRACT iii 第一章 绪论 1 1.1 问题的提出及研究意义 1 1.1.1 问题的提出 1 1.1.2 研究的意义 2 1.2 国内外研究现状 3 1.3 本文的研究目标和研究内容 5 1.3.1 本文的研究目的 5 1.3.2 本文的主要内容 5 1.3.3 论文结构安排 5 第二章 汉字文档图像的生成和获取 7 2.1 汉字文档图像的生成 7 2.1.1 文档图像数字化 7 2.1.2 文档图像的获取 8 2.2 汉字文档图像的特征 9 2.2.1 自然特征 9 2.2.2 统计特征 10 2.2.3 变换系数特征 11 第三章 汉字文档图像预处理 13 3.1 图像的灰度化 13 3.2 图像背景处理 14 3.3 文档图像倾斜检测与校正 15 3.4 扭曲文档图像恢复 15 3.5 文档图像滤波去噪 16 第四章 图像分割方法 19 4.1 常用的图像分割方法 19 4.2 常用的文档图像分割方法 21 第五章 基于最大梯度差的汉字文档图像图文分割 23 5.1 引言 23 5.2 算法流程 23 5.2.1 灰度转换 24 5.2.2 计算梯度和最大梯度差 24 5.2.3 文本区域融合 27 5.2.4 文本区域孔洞填充 27 5.2.5 非文本区域滤波 27 5.2.6 边界调整 27 5.3 实验结果 28 5.4 结论 32 第六章 基于小波变换的汉字文档图像图文分割 33 6.1 引言 33 6.2 算法流程 33 6.2.1 灰度变换 34 6.2.2 离散小波变换 34 6.2.3 提取文本边缘 35 6.2.4 非文本区域滤波 35 6.3 实验结果 36 6.4 结论 42 第七章 总结与展望 43 参考文献 45 攻读硕士学位期间发表的论文 48 致 谢 49 i i PAGE PAGE iv 汉字文档图像的图文分割方法研究 摘 要 随着信息技术的发展,文档图像在数字图书馆、办公自动化、网上阅卷、电子政务、 电子商务等项目中获得广泛的应用。在这些应用中,纸质文档通常采用扫描方式形成数 字化文档图像进行存储、传输、显示和打印。为了保证对文档图像的有效处理,对文档 图像的分割研究显得尤为重要。 图像分割算法经过几十年的研究,目前基于各种理论已提出了上千种各种类型的分 割算法。由于目前尚没有通用有效的分割理论,因此,现已提出的各种分割算法大都是 针对具体应用问题的,并没有一种对所有类型图像都适用的通用的分割算法。尽管有人 试图建立分割模型并根据模型进行图像分割,但都并不太成功,因此定制化的分割方法 才是较为有效的分割方法。 论文首先介绍了文档图像的生成并分析了文档图像的特点,指出文档图像是由一些 具有特定性质的区域块组合而成,通常包括文字块、线图、连续色调图像(真彩色图) 和半色调图像(带调色板的图)。其中,文字和线图保存了图像较多的细节以及结构信 息,具有较高的空间分辨率特征,这一部分区域对颜色分辨率的要求不高;而连续色调 和半色调的图像则保存了较多的颜色信息,通常要求较高的颜色分辨率,但对空间分辨 率的要求不高。也就是说文档图像大多数是由具有明显不同特征的部分组合而成,通常 来说包含文本区域、线图区域和插图区域,而文本区域又包含文字的轮廓和文字的背景 颜色,插图区域通常是高分辨率的彩色图像。这些区域不仅在逻辑意义上具有独立性, 而且在颜色分辨率和空间分辨率上也具有明显不同的特性。这种图像特征明显,同时在 逻辑上具有独

文档评论(0)

1234554321 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档