基干移动端图像识别题库采集模型实践探讨.docVIP

下载本文档

0
0
约4.18千字
约 9页
2017-05-29 发布于福建
举报
版权申诉

基干移动端图像识别题库采集模型实践探讨.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基干移动端图像识别题库采集模型实践探讨

基于移动端图像识别的题库采集模型实践研究　　摘要：借助图像识别技术，我们不仅可以通过图片搜索更快地获取信息，还可以产生一种新的与外部世界交互的方式，甚至会让外部世界更加智能地运行。本文通过对题库建设中采集题库的现状进行分析，给出了基于移动端图像识别的题库建设方案关键词：图像识别；OCR；题库采集；移动终端；特征建模中图分类号：G434 文献标识码：A 论文编号：1674-2117（2016）12-0075-04 ● 采集题库的现状随着经济和社会的发展、“互联网+”的广泛应用及教育观念的更新，我们迫切需要科学、方便、完善的网络型题库管理系统。试题库建设是教育现代化的需要，是考教分离、最大限度提高办学效益的需要，因此，进行区域网络试题库系统的建设和研究具有十分重要的意义受限于教材版本和区域应用层面的需求，采购商业化的题库并不能完全满足教育教学的实际要求。手握大量纸质试卷的老师们，迫切需要一个录入神器，方便快捷地将其录入到题库系统里利用基于移动终端的图像文字识别技术将文字和图片迅速录入题库是我们在移动端系统开发的应用亮点。它能够大幅提高对质量不高图像的识别率，其关键算法对图像的噪声、亮度明暗不一致和规格凌乱的问题进行了很好的处理。它能够将图像上传到服务器进行在线识别，在识别过程中先对图像进行消噪，然后对亮度进行均衡处理及对图像阈值分割，提高了图像识别的成功率 ● 题库采集系统工作流程题库采集主要分为图像采集、图像识别和标注三个过程。整体的工作流程包括：①系统启动，进入主界面，可选择开始拍摄阅卷或读取设备中已有的图像，如选择拍摄题目，进入图像采集模块，调用移动设备的摄像头进行拍摄，拍摄成功后，跳转至识别界面，如选择读取相册已有图像也跳转至识别界面。②在识别界面上显示出拍摄或者读取的相册图像，首先调用图像预处理模块对图像进行预处理，输出预处理后的图像，然后调用图像校正模块对预处理图像进行校正，输出校正图像，最后调用图像识别模块对校正图像进行识别，输出识别结果。③调用标注模块对识别结果进行分类管理，为题目添加系统属性，如学科、章节、知识点类目、题型、难度系数等标签。图1为题库采集系统工作流程示意图 ● OCR智能模型设计思路在人工智能领域，模拟人类图像识别活动的计算机程序，人们提出了不同的图像识别模型――模板匹配模型。这种模型认为，识别某个图像，必须在过去的经验中有这个图像的记忆模式，又叫特征模型。当前的刺激如果能与大脑中的模型相匹配，这个图像也就被识别了。例如，有一个字母A，如果在脑中有个A模板，字母A的大小、方位、形状都与这个A模板完全一致，字母A就被识别了。图像识别中的模型识别（Pattern Recognition）利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别、评价的过程那么如何通过模型的学习提高OCR的智能判断水平呢？我们主要从以下三个方面做了实践研究 1.采集识别优化（1）二值化处理二值图像在数字图像处理中占重要地位，其在处理实际图像过程中地位更加突出。要应用二值图像，扫描文档之后的第一步就是对灰度图像根据所选阈值进行二值化处理。二值图像是像素值为0或255的像素点集合，如此一来，图像的数据量大大减少，但图像的基本轮廓信息得以保留。此项的关键是所选取的阈值是否得当，不当则会减弱二值图像的处理效果。常用的阈值选取方法有固定阈值法、平均阈值法、直方图法、Means法四种谷歌公司在HP公司Tesseract光学字符识别引擎的基础上做了深度加工，其中对阈值的自适应分类器和两步矫正法的应用大大提高了文本的识别效率。近几年来，百度针对商业运用开发了自然场景OCR API服务，依托百度的OCR算法，提供了整图文字检测、识别、整图文字识别、整图文字行定位和单字图像识别等功能。目前火热的作业帮APP就是基于百度识别API做的延伸产品（如图2）（2）图像去噪与矫正任何一幅原始图像，在其获取和传输的过程中，都会受到各种噪声的干扰，使图像质量下降，淹没其特征，对图像分析非常不利。为抑制噪声、改善图像质量所进行的处理被称为图像平滑或去噪图像平滑是用于突出图像的宽大区域和主干部分（低频部分）或抑制图像噪声和干扰（高频部分），使图像平缓渐变，减小突变梯度，改善图像质量的图像处理方法。它属于图像增强的一部分，主要的图像平滑方法有均值滤波、中值滤波、灰度形态学滤波、小波滤波、高斯低通滤波以及统计方法滤波已获得的文本图像有些不可避免地会发生倾斜，这样会给后面文字的行切分和列切分以及文字的识别带来困难，所以需要对获取的图像进行倾斜校正。图像的倾斜校正最关键的是倾斜角的检测，我们主要采用平行四边形法进行文本图像