OCR自动阅卷解决方案.docVIP

  • 10
  • 0
  • 约3.45千字
  • 约 8页
  • 2020-10-08 发布于河南
  • 举报
PAGE 5 OCR自动阅卷 解 决 方 案 北京文通科技有限公司 2014年4月 目录 TOC \o 1-3 \h \z \u 第一章 背景介绍 1 第二章 系统概述 2 第三章 解决方案 2 1. 处理流程 2 2. 功能介绍 3 3. 系统拓扑结构 5 4. 方案组成 6 5. 系统特点 7 6. 应用效果 8 背景介绍 问卷是政府机关、教育机构、公司、企业和媒体做专题调查并且期望得到结果的一种方式。对问卷结果的录入和统计传统方式都是采用人工作业,对于数量特别多的问卷,处理起来会花费大量的人力和时间,甚至不能在期望的时间内完成。另外,有些调查问卷也是客户、会员等资料的收集渠道,因此调查问卷的结果除了进行必要的保存以及分析外,还需要进行必要的影像管理和查询。例如像一年一度的全国高考这样的大型考试,数千万份试卷的批阅,对高考的阅卷系统就提出了严峻的挑战。 系统概述 传统的人工阅卷方式,工作量大,出错率高,整个过程可谓高成本低效率。而传统的OMR阅卷技术也随着近年来的大范围应用,其不足之处也日渐显现:首先是对答题卡的印刷质量要求非常苛刻,答题卡不能折叠、起皱,字迹亦不能潦草,否则处理起来困难重重,错判误判现象更是时有发生。OMR答题方式并不直观,考生涂填答题卡时非常容易出错,例如错位;信息采集量少,不易改变答题卡的内容;不能保存原始图像,查对时必须对照原卡或原考卷,极大地增加了工作量;如果考生想修改所选答案,由于擦涂不干净,极易产生错判现象,特别是当考生进行多项选择时。OMR技术的不足,在考生资源巨大的情形下尤其明显,例如高考。由于OMR技术对考生成绩误判、错判、漏判的现象屡屡发生,在一定程度上严重影响了考试的公平公正性。 针对当前市场上的实际需求,文通科技推出了基于清华TH-OCR(光学字符识别)技术的自动阅卷系统,该系统首先通过高速扫描仪对问卷进行快速扫描,然后对扫描得到的图像进行OCR识别,最后对识别得到的结果进行校对,并将校对后的结果存入数据库中。文通OCR自动阅卷系统为广大用户提供了一套完整而周全的解决方案,充分满足了用户对问卷数据采集的四个需求:高质量、高效率、低成本、低风险。 作为该解决方案的核心,清华TH-OCR识别引擎,是由清华大学电子工程系智能图文信息处理实验室研制,是国家“863”计划支持的重要科研成果。该识别引擎包含了表格处理、手写数字识别、印刷体中英文识别等多种技术,在识别率、适应能力、校对能力等方面均位居国际领先水平。 解决方案 处理流程 识别问卷扫描识别 识别 问卷扫描识别 功能介绍 问卷扫描 系统连接高速扫描仪,按照每份问卷的页序进行扫描。系统会自动按照每份问卷的页数分组,并添加到主界面左边的树结构中。高速扫描仪的扫描速度在30~60页/分钟。 问卷识别 系统自动对扫描进来的问卷识别,首先自动分类问卷,然后依据不同的模板对问卷OCR识别。识别速度平均为1张/秒,结合扫描速度30~60页/分钟,扫描和识别可以同步处理,系统总体处理速度为30~60页/分钟,以人工阅卷1~2分钟/页对比,OCR的数据采集速率是人工阅卷速率的30~120倍(注:表格的复杂程度对人工阅卷速率的影响明显,而对OCR系统处理速率的影响微乎其微),可见OCR技术的绝对优势。 问卷校对 系统提供全图映射校对方式,直观简洁,用户光标定位到任一窗口的任一位置,系统会自动定位到另一窗口的对应位置。 数据入库统计 系统按照预先建立的问卷表,把识别的结果导入到相应的数据表中,并按照问卷设定的评分规则实时对数据做评分计算,评分统计结果与问卷扫描识别同步完成。 报表输出 用户可定制丰富的报表输出,定制查询和报表输出功能,用户可方便打印各单位的得分情况和总体的考评情况,及时掌握各单位年度的工作情况。 系统拓扑结构 可根据不同的应用场景灵活配置,根据问卷调查的规模确定处理客户端的数量,系统具有很强的可扩展性;方案的部署比较简单,在现场布置局域网即可,甚至扫描识别客户端、数据库、任务管理工作都可以在一台计算机上完成。系统的拓扑图如下: 方案组成 扫描仪及驱动程序 扫描仪对问卷快速扫描,驱动软件具有智能化处理的完美页面扫描功能,自动完成影像的歪斜校正、原稿尺寸裁剪、去底色、旋转、去白页等功能。可同时得到扫描稿件的黑白、灰度、彩色三种影像输出,并且针对税票特征配置了最优化的对比度、亮度,为后续OCR(文字识别)提供优质的影像。 OCR自动阅卷客户端软件 文通OCR识别技术已在中组部、全国武警总队系统中成

文档评论(0)

1亿VIP精品文档

相关文档