- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于adaboost的场景文本定位研究-计算机科学与技术专业论文
万方数据
万方数据
Classified Index:TP391
Dissertation for the Master Degree in Engineering
Research on Text Location Based on Adaboost in Natural Images
Candidate: Zheng Liang
Supervisor: Yin Fang
Academic Degree Applied for: Master of Engineering Specialty: Computer Applied Technology Date of Oral Examination: March, 2016
University: Harbin University of Science and Technology
哈尔滨理工大学硕士学位论文原创性声明
本人郑重声明:此处所提交的硕士学位论文《基于 Adaboost 的场景文本定 位研究》,是本人在导师指导下,在哈尔滨理工大学攻读硕士学位期间独立进行 研究工作所取得的成果。据本人所知,论文中除已注明部分外不包含他人已发 表或撰写过的研究成果。对本文研究工作做出贡献的个人和集体,均已在文中 以明确方式注明。本声明的法律结果将完全由本人承担。
作者签名: 郑亮 日期:2016 年 3 月 19 日
哈尔滨理工大学硕士学位论文使用授权书
《基于 Adaboost 的场景文本定位研究》系本人在哈尔滨理工大学攻读硕士 学位期间在导师指导下完成的硕士学位论文。本论文的研究成果归哈尔滨理工 大学所有,本论文的研究内容不得以其他单位的名义发表。本人完全了解哈尔 滨理工大学关于保存、使用学位论文的规定,同意学校保留并向有关部门提交 论文和电子版本,允许论文被查阅和借阅。本人授权哈尔滨理工大学可以采用 影印、缩印或其他复制手段保存论文,可以公布论文的全部或部分内容。
本学位论文属于
保密 ,在 年解密后适用授权书。 不保密 √ 。
(请在以上相应方框内打√)
作者签名: 郑亮 日期: 2016 年 3 月 19 日
导师签名: 尹芳 日期: 2016 年 3 月 19 日
哈尔滨理工大学工学硕士学位论文
哈尔滨理工大学工学硕士学位论文
基于 Adaboost 的场景文本定位研究
摘 要
随着多媒体网络技术的发展,大量场景图片进入了人们的学习、生活和 工作当中,场景中的文本信息作为一种重要的语义信息,对场景的理解、分 析和检索有着重要的作用。因为自然场景中文本的颜色五颜六色,字体大小 不一,这使得场景中的文本定位比起传统文档文本定位更加具有复杂性,因 此场景中的文本定位成为了计算机视觉中的重要研究课题。本文在研究和总 结近 10 年国内外文本定位方法的基础之上,对场景文本定位进行了深入研 究,提出一种基于 Adaboost 的场景文本定位方法,主要包含图像的预处理、 生成候选文本区域、特征提取和候选文本区域的分类四部分。
在预处理阶段,通过实验比较了灰度化处理的三种方法,最大值法、平 均值法和加权平均值法,并对实验结果的优缺点进行对比分析,提出了选用 加权平均值的方法对图像进行灰度化处理;提出了一种基于改进的 Sobel 算 子边缘检测算法,实验结果表明,本方法不仅能够有效地提取图像的边缘, 而且能够很好地解决边缘检漏问题,并且具有一定的抗噪性能。
在生成候选文本区域过程中,本文提出了使用文本尺寸特征和边缘密度 特征来表征文本字符特征,实验表明,利用这两种特征对连通区域进行分析 与筛选,能够大量地排除明显不属于文本区域的连通区域,最终得到候选文 本区域。
本文提取了 4 类场景文本特征,分别是 Gabor 特征、笔画密度、纹理统 计特征和图像导数的方差和期望,实验结果表明,这 4 类文本特征分别构建 的分类器对文本区域的分类都有一定的作用。
本文通过改进经典的 Adaboost 算法,提出基于 Adaboost 的场景文本定 位方法,利用分类与回归决策树((CART, Classification And Regression Tree) 的 Adaboost 算法对 4 类本文提取的文本特征生成的弱分类器进行组合,生成 了 一 个 对 场 景 文 本 区 域 具 有 很 强 分 类 能 力 的 场 景 文 本 分 类 器 , 然 后 利 用 Adaboost 强分类器对候选文本区域进行筛选,最终获得了正确的文本区域。
本文建立的数据库包含了 300 幅自然场景图像,分类器的训练样本为 200
幅图像,分类器的测试样本为 100 幅图像。本文所提出的方法对文本进行定 位的准确率为 82.8%,召回率为 85.8%。实验表明,利用同样的测试样本,
I -
本文定位
您可能关注的文档
- 基于fluent的微型电动汽车车身造型与优化-机械工程专业论文.docx
- 基于arm和无线射频技术的智能家居控制系统设计-控制工程专业论文.docx
- 基于.net的erp电子沙盘系统的设计与实现-软件工程专业论文.docx
- 基于can总线随钻测井系统设计与实现-控制工程专业论文.docx
- 基于fpga高速时间交织adc校准与研究-集成电路工程专业论文.docx
- 基于fpga的图像采集处理系统的应用研究-测试计量技术及仪器专业论文.docx
- 基于4g的车载音视频传输终端的设计与实现-电子与通信工程专业论文.docx
- 基于.net的交互式组件对象模型在网络教育中的应用研究与系统实现-计算机应用技术专业论文.docx
- 基于can总线的桥梁检测车控制系统研究-机械工程专业论文.docx
- 基于agent的智能元搜索引擎群组推荐机制的研究-计算机软件与理论专业论文.docx
- 基于fpga的伺服电机测速与控制系统研究-机械电子工程专业论文.docx
- 基于fpga的交流伺服系统工业以太网接口技术研究及开发-机械电子工程专业论文.docx
- 基于 ct 图像沥青混合料三维有限元数值模拟研究-桥梁与隧道工程专业论文.docx
- 基于can总线的电子驻车制动系统的设计与研究-车辆工程专业论文.docx
- 基于celts标准的网络智能授导系统研究-计算机应用技术专业论文.docx
- 基于ason的高速公路视频监控系统应用研究-电子与通信工程专业论文.docx
- 基于fpga的电旋转系统实验平台的设计与实现-测试计量技术及仪器专业论文.docx
- 基于dm642的视频图像压缩系统实现及其应用研究信息与通信工程专业论文.docx
- 基于fpga和microblaze的嵌入式技术在蔗糖含量检测中的应用研究-控制工程专业论文.docx
- 基于 cfd 的选择性取水引流作用下藻类迁移控制模拟及强化选择性取水技术的研发-市政工程专业论文.docx
最近下载
- SJG 05-2020 基坑支护技术标准.docx VIP
- 综合实践劳动课教案.docx VIP
- 2023年高校教师资格证教育心理学.doc VIP
- 海书专升本刷题测试卷15.docx VIP
- 贵司专升本磨刀进阶营大学英语第一次模拟测试.docx VIP
- 统编版语文二年级上册第四单元、第五单元复习课教案(各一套).doc VIP
- 浅谈宽带电力载波与窄带电力载波在电力抄表中的利弊关系(行业资料).doc VIP
- 护理人员分层培训现状调查.docx VIP
- 2025至2030中国IPv6行业市场发展分析及行业前景预测报告.docx VIP
- 中国临床肿瘤学会(csco)胰腺癌诊疗指南2025.docx VIP
原创力文档


文档评论(0)