- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于OCR技术的智能投影系统的设计分析.doc
基于OCR技术的智能投影系统的设计分析
摘 要 为了实现对“动态”观看杂志报刊,提出了基于OCR技术的智能投影系统。通过摄像头采集数据,OCR技术对文字识别和处理,嵌入式技术实现可携带移动设备在“云端”访问在线视频,最后经摄像头对访问到的视频进行投影实现。经过理论分析和相关技术支持,表明基于OCR技术的智能投影系统可实现对文字的识别及对视频的搜索和投影。
关键词 OCR技术;文字识别;嵌入式技术;云端;智能投影
中图分类号:TP273 文献标识码:A 文章编号:1671-7597(2013)16-0023-01
在信息交互日益重要的人类社会中,阅读纸质报刊,杂志在很长时间里成为人们了解世界,与世界联结的主要途径。但随着科技的迅猛发展,特别是自媒体的涌现,对传统报刊、杂志的发展造成了极大的冲击。人们可以通过互联网迅速了解当下的新闻,获悉自己想要的知识,而传统报刊,杂志业日益衰退。但由于人们长久以来对纸质文化的依赖而形成的习惯,使得传统媒体业依然有生存下去的可能,而这就需要其充分提高创新性,与现代科技进行融合,创造“高科技”纸质文化。
通过人们阅读报纸,杂志时,加入相关新闻的动态视频无疑是一大创新点。而通过现有的OCR核心技术,实现报刊关键字识别与搜索,可实现对相关视频在报刊上进行智能投影。
1 OCR技术简介
OCR(Optical Character Recognition)光学字符识别技术,是自动识别技术领域一个重要的方面。该技术利用扫描仪、摄像机等任何摄影器材检测纸质文件上的字符,通过检测亮、暗的模式确定其形状,然后利用字符识别方法将形状翻译成计算机文字的过程。具体工作过程为,汉子文稿的光信号通过电荷耦合器件CCD转换为电信号,再经过模数转换器转换为数字信号传输给计算机。衡量OCR系统性能好坏的主要指标有:误识率、拒识率、识别速度、产品稳定性,用户界面友好性,易用性和可行性等。
软件结构包括图像输入和预处理。
1.1 图像的输入
对于不同图像格式,图像的存储格式,压缩方式不同。在图像摄入时选择适宜的分辨率,调整好对比对和亮度值对于提高图像的摄入质量很重要。
1.2 图像的预处理
1.2.1 二值化
当用摄像头拍摄的图片为彩色图像时,由于彩色图像包含信息量巨大,为了让计算机更快,更好识别文字,我们要先对彩色图进行处理,使图片只分为前景信息和背景信息,所以可以简单地定义前景信息为黑色,背景信息为白色,即二值化图。
1.2.2 噪声去除
图片受到干扰会含有噪声,噪声的存在会使图像模糊,降低图像的质量,我们可以根据噪声特征不同选取相关的图像平滑处理,即噪声去除。
1.2.3 倾斜校正
在拍照文档时由于拍摄角度的随意使拍摄出的图片不可避免地产生倾斜,这就需要文字识别软件进行校正。
除此之外图像预处理还包括版面分析、字符切割、字符识别等过程。
2 嵌入式系统的应用
嵌入式系统指操作系统和功能软件集成于计算机硬件系统中,即将系统的应用软件和硬件一体化。其具有软件代码小,高度自动化,响应速度快等特点,特别适合要求实时和多任务的体系。采用特殊的算法如基于统计原理的算法,可实现OCR技术在嵌入式系统上的实现。在该智能投影系统中,通过OCR技术识别处理后的关键字返回给嵌入式芯片,嵌入式芯片通过web搜索技术,通过接受到的关键字访问“云端”在线视频,然后将搜索到的相关视频返回给嵌入式芯片,由芯片处理后输出给投影仪投影在报纸或杂志纸面上。在此,可提出构想,主流报刊、杂志可以与云计算公司或视频网站合作建立专门用于该报刊、杂志所刊载内容相关视频的视频数据库,以便于更快搜索、投影。
3 系统主要组成及工作
本智能投影系统由微型摄像头,OCR文字识别处理软件,小型投影仪及相关嵌入式芯片组成可携带移动设备。可将本系统组成的携带式移动设备挂在胸前或制作成帽子等装备,以使摄像头及投影仪可方便拍摄报刊上的标题以及将相关视频投影其上。工作过程为,摄像头拍摄报刊文字标题,将数据传输给OCR文字处理软件,处理后的文字信息输入至嵌入式芯片,芯片利用关键字搜搜技术搜索“云端”在线视频,并将搜索到的相关视频传输给投影仪,投影仪投影在报纸或杂志版面上,读者便可实现“动态”观看报刊杂志了。本系统的主要工作流程图如图1。
4 结束语
本系统充分利用了现有前端技术,OCR技术以及嵌入式系统的方便灵活,构建了“动态”观看报刊杂志的实现方式,使传统媒体业与现代科技结合,更好地随时代发展。
参考文献
[1]汪益民,梅林,张义超.基于OCR技术的书写文字识别系统设计[J].计算机工程,2007,23(8):17-19.
[2]迟春佳
文档评论(0)