人工神经网络课程设计-神经网络在CET主观题阅卷中空白题识别.docVIP

人工神经网络课程设计-神经网络在CET主观题阅卷中空白题识别.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
神经网络在CET主观题阅卷中空白题识别方课题背景 随着计算机技术的发展,一些大规模考试(如)的阅卷方式已由传统的纸笔阅卷过渡到计算机甚至网上阅卷。其中,主观题的阅卷一般是将原始试卷扫描成灰度图像,再将图像输出到显示器上供阅卷员评阅。以为例,先是将主观题答题卡扫描成灰度图像,再按题目将图像分割成一个个小块,每道题目为一个图像文件,最后把一个个图像文件依次输出到显示器。我们自身的阅卷经历以及对部分阅卷员的访谈表明,每次主观题阅卷都会有一定数量的空白题。如果这些空白题不必由阅卷员评分,而是由计算机自动识别并赋分,无疑能减轻阅卷员的工作量,提高阅卷效率,降低阅卷成本,节约人力、物力和财力。 从扫描后的图像来看,空白题和非空白题的主要区别在于像素灰度值,作答部分的灰度值接近,空白部分接近。但由于作答笔迹有轻有重,扫描清晰度不高,很难直接用像素灰度值加以区分(贾志先),需采用一定的技术进行识别。实现空白题自动识别的技术路线较多,如神经网络、支持向量机等。其中神经网络较为简单实用。本研究将尝试利用神经网络进行空白题识别技术的开发,并讨论该技术在主观题阅卷中的应用。利用神经网络进行空白题识别,最关键的是要保证识别的准确性与稳定性,即保证未作答的空白题一定赋分,而考生作答了的一定不赋分,留待人工评阅。如何确保空白题识别技术具有较高的准确性与稳定性是本研究需解决的主要问题。 二、理论基础 神经网络是一种能够模拟人脑结构及功能的信息处理系统。其基本单位是神经元,这一点与人脑相似。神经网络并不依赖事先编好的程序去运行,而是通过训练去调整自身权值,具有自组织、自学习、非线性逼近的能力()。由于神经网络具有这些能力,它能够反映人脑功能的许多基本特征,近年来在人工智能、自动控制、信息处理等方面取得了广泛应用(董长虹;韩力群)。在教育考试领域,神经网络被应用于试卷等值、空白题识别等方面,如贾志先()曾使用神经网络识别(汉语水平考试)的空白题,取得了较好的识别效果。通过学习空白题和非空白题的特征,不断调整自身权值,神经网络可以像人脑一样把空白题准确识别出来。然而, 用汉语答题,用英语答题,书写文字的不同可能导致不同的识别效果。此外,若特征参数、实验模型、训练函数、学习函数、传递函数和隐藏层神经元数目等设置不同,识别效果可能也不同,需通过实证加以探究。我们的思路如下:首先提取可靠的特征参数,其次选取合适的网络模型、函数及神经元数目,最后通过对网络的训练调试达到最佳识别效果。 三、实现方法  空白题特征参数的提取 对空白题进行识别,首先要提取出能区分空白题和非空白题的特征参数。我们发现,空白题由于没有任何作答记号,扫描后图像各像素的灰度值均接近,其标准差较小。非空白题由于有作答记号,扫描后这些作答部分的像素灰度值接近,而其它部分的像素灰度值接近,从而导致其标准差很大。因此,我们拟使用标准差作为区分空白题和非空白题的特征参数。假设一幅图像大小为m×n像素,则其像素灰度值矩阵为: 图像像素灰度值矩阵A 的行向量的标准差为: 其中u1,u2,…,um为图像灰度值矩阵A 的各行向量的平均值。 的列向量的标准差为 其中v1,v2,…,vn为图像灰度值矩阵 的各行向量的平均值。 然而,直接以这些向量作为神经网络的输入,数据量太大,且由于m 和n 的取值不确定,神经网络输入层的神经元数目也无法确定。因此,我们对行向量和列向量的标准差继续求标准差,得到一个二维数组[x1,x2],其中x1为行向量标准差的标准差,x2为列向量标准差的标准差。这样,我们就可以用x1和x2两个参数作为区分空白题和非空白题的特征参数。实现这些步骤的Matlab代码为: f=imread(‘...’);∥载入图像灰度值矩阵f,其中…为载入图像的文件名∥ x1=std(std(double(f’)));∥求行向量标准差的标准差,f’为图像灰度值矩阵的转置矩阵∥ x2=std(std(double(f)))。∥__________求列向量标准差的标准差∥ 神经网络模型的构建 使用神经网络需根据研究自身特点选取合适的网络模型。本研究选取Elman神经网络模型。Elman网络由Elman于1990年提出,并由Pham和Liu于1992年加以改进,是一种动态的反馈网络。该模型在前馈网络的隐藏层中增加一个反馈层作为延时算子,以达到记忆的目的,从而使系统具有适应时变特性的能力,能直接反映动态过程系统的特性(Elman1990;Pham & Liu 1992;Shi et al.2004)。其优点是对目标函数的逼近度高、自学习能力强;不足之处是需要的神经元数目可能较多,可能导致网络结构庞大、学习时间较长。 Elman网络由输入层、隐藏层、反馈层和输出层组成。输入层用于输入信号,隐藏层对来自输入层的信号进行一定处理,反馈层用

文档评论(0)

love + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档