- 10
- 0
- 约3.45千字
- 约 8页
- 2020-10-08 发布于河南
- 举报
PAGE 5
OCR自动阅卷
解
决
方
案
北京文通科技有限公司
2014年4月
目录
TOC \o 1-3 \h \z \u 第一章 背景介绍 1
第二章 系统概述 2
第三章 解决方案 2
1. 处理流程 2
2. 功能介绍 3
3. 系统拓扑结构 5
4. 方案组成 6
5. 系统特点 7
6. 应用效果 8
背景介绍
问卷是政府机关、教育机构、公司、企业和媒体做专题调查并且期望得到结果的一种方式。对问卷结果的录入和统计传统方式都是采用人工作业,对于数量特别多的问卷,处理起来会花费大量的人力和时间,甚至不能在期望的时间内完成。另外,有些调查问卷也是客户、会员等资料的收集渠道,因此调查问卷的结果除了进行必要的保存以及分析外,还需要进行必要的影像管理和查询。例如像一年一度的全国高考这样的大型考试,数千万份试卷的批阅,对高考的阅卷系统就提出了严峻的挑战。
系统概述
传统的人工阅卷方式,工作量大,出错率高,整个过程可谓高成本低效率。而传统的OMR阅卷技术也随着近年来的大范围应用,其不足之处也日渐显现:首先是对答题卡的印刷质量要求非常苛刻,答题卡不能折叠、起皱,字迹亦不能潦草,否则处理起来困难重重,错判误判现象更是时有发生。OMR答题方式并不直观,考生涂填答题卡时非常容易出错,例如错位;信息采集量少,不易改变答题卡的内容;不能保存原始图像,查对时必须对照原卡或原考卷,极大地增加了工作量;如果考生想修改所选答案,由于擦涂不干净,极易产生错判现象,特别是当考生进行多项选择时。OMR技术的不足,在考生资源巨大的情形下尤其明显,例如高考。由于OMR技术对考生成绩误判、错判、漏判的现象屡屡发生,在一定程度上严重影响了考试的公平公正性。
针对当前市场上的实际需求,文通科技推出了基于清华TH-OCR(光学字符识别)技术的自动阅卷系统,该系统首先通过高速扫描仪对问卷进行快速扫描,然后对扫描得到的图像进行OCR识别,最后对识别得到的结果进行校对,并将校对后的结果存入数据库中。文通OCR自动阅卷系统为广大用户提供了一套完整而周全的解决方案,充分满足了用户对问卷数据采集的四个需求:高质量、高效率、低成本、低风险。
作为该解决方案的核心,清华TH-OCR识别引擎,是由清华大学电子工程系智能图文信息处理实验室研制,是国家“863”计划支持的重要科研成果。该识别引擎包含了表格处理、手写数字识别、印刷体中英文识别等多种技术,在识别率、适应能力、校对能力等方面均位居国际领先水平。
解决方案
处理流程
识别问卷扫描识别
识别
问卷扫描识别
功能介绍
问卷扫描
系统连接高速扫描仪,按照每份问卷的页序进行扫描。系统会自动按照每份问卷的页数分组,并添加到主界面左边的树结构中。高速扫描仪的扫描速度在30~60页/分钟。
问卷识别
系统自动对扫描进来的问卷识别,首先自动分类问卷,然后依据不同的模板对问卷OCR识别。识别速度平均为1张/秒,结合扫描速度30~60页/分钟,扫描和识别可以同步处理,系统总体处理速度为30~60页/分钟,以人工阅卷1~2分钟/页对比,OCR的数据采集速率是人工阅卷速率的30~120倍(注:表格的复杂程度对人工阅卷速率的影响明显,而对OCR系统处理速率的影响微乎其微),可见OCR技术的绝对优势。
问卷校对
系统提供全图映射校对方式,直观简洁,用户光标定位到任一窗口的任一位置,系统会自动定位到另一窗口的对应位置。
数据入库统计
系统按照预先建立的问卷表,把识别的结果导入到相应的数据表中,并按照问卷设定的评分规则实时对数据做评分计算,评分统计结果与问卷扫描识别同步完成。
报表输出
用户可定制丰富的报表输出,定制查询和报表输出功能,用户可方便打印各单位的得分情况和总体的考评情况,及时掌握各单位年度的工作情况。
系统拓扑结构
可根据不同的应用场景灵活配置,根据问卷调查的规模确定处理客户端的数量,系统具有很强的可扩展性;方案的部署比较简单,在现场布置局域网即可,甚至扫描识别客户端、数据库、任务管理工作都可以在一台计算机上完成。系统的拓扑图如下:
方案组成
扫描仪及驱动程序
扫描仪对问卷快速扫描,驱动软件具有智能化处理的完美页面扫描功能,自动完成影像的歪斜校正、原稿尺寸裁剪、去底色、旋转、去白页等功能。可同时得到扫描稿件的黑白、灰度、彩色三种影像输出,并且针对税票特征配置了最优化的对比度、亮度,为后续OCR(文字识别)提供优质的影像。
OCR自动阅卷客户端软件
文通OCR识别技术已在中组部、全国武警总队系统中成
原创力文档

文档评论(0)