基于深度学习的智能作业批改系统设计与实现.docxVIP

基于深度学习的智能作业批改系统设计与实现.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于深度学习的智能作业批改系统设计与实现

随着高等教育规模的扩张,教师作业批改压力日渐增加,既耗费教师的时间与精力,也影响教师对学生个性化辅导的投入。同时,教育信息化的发展使数字化教育开始普及,对作业批改智能化提出了迫切需求,传统人工批改已难以适应时代发展步伐1]。在此背景下,一些学者积极开展研究,利用图像识别、大数据提取等技术尝试创建智能作业批改系统。例如,郑克松提出了智能化eNSP实训自动批改技术,利用VRP配置文件解析算法与多尺度图像模板匹配算法实现了实时评估与批改[2;刘代雄等开发了一套通用性系统,实现了自动规整作业格式、以图形化交互方式的批阅过程,提高了完成单次作业批改全流程的效率[3。这些研究虽提供了一些有效方法,但在面对字迹模糊、不规则图形等作业图像时的适应性略有不足。有的研究虽引入机器学习方法,但在识别精度上难以满足现实所需。鉴于此,本文设计一种基于深度学习的智能作业批改系统,以期进一步提升作业批改效率与质量。

1.基于深度学习的智能作业批改系统算法介绍

本系统主要采用图像识别、图像处理等技术路径。在图像识别上,通过边缘轮廓检测、图文扫描、文字识别三阶段处理,结合Laplacian算子、SCAN算法与卷积神经网络(convolutionalneuralnetworks,CNN)将作业图像转化为可识别的文本信息;在图像处理上,综合运用二值化处理、滤波处理和旋转变换处理等技术对原始作业图像进行降噪、增强和校正。这些算法的结合既保障了图像高效提取,又提升了系统对复杂作业场景的适应性。

1.1作业图像识别

利用TensorFlow图像扫描识别字符时,流程一般为边缘轮廓检测、图文扫描、文字识别等。

1.1.1边缘轮廓检测

在作业纸图像中,文字、图形等元素的边缘信息蕴含着丰富特征,通过Laplacian算子进行边缘检测计算可提取图像边缘轮廓[4]。该算法基于图像灰度值的梯度变化,首先计算图像的梯度幅值和方向;其次对梯度幅值进行非极大值抑制,去除非边缘的伪边缘点;再次通过双阈值检测确定真正边缘点与可能边缘点;最后对可能边缘点进行边缘连接,从而得到清晰边缘轮廓,可将其表示为

式中,G(x,y)表示梯度幅值,表示图像在x方向上的梯度,表示图像在y方向上的梯度。边缘轮廓检测为后续图文扫描提供了基础,使扫描过程能更有针对性地聚焦有效信息区域。

1.1.2图文扫描

完成边缘轮廓检测后进入图文扫描阶段,此时利用SCAN算法沿着边缘轮廓界定区域进行逐行或逐列扫描。在本系统中,从图像顶部开始,按照固定行距依次向下扫描,记录每行像素变化。对于文字区域,因文字像素与背景像素存在显著差异,所以通过设定阈值区分出文字像素点。在灰度图像中,如果像素值高于阈值128则判定为文字像素,低于该阈值则为背景像素。通过这种扫描,能够将图像中的图文信息转化为可进一步处理的像素序列。

1.1.3文字识别

经过边缘轮廓检测与图文扫描后,得到的像素序列需要被识别为具体文字。使用基于深度学习的卷积神经网络(convolutionalneuralnetworks,CNN)构建卷积层、池化层和全连层,自动学习文字图像的特征。卷积层利用卷积核在图像上滑动进行卷积,提取笔画方向等图像局部特征;池化层则对卷积层输出的特征图进行下采样,减少数据量的同时保留主要特征;全连层将经过多次卷积和池化后的特征进行整合,通过softmax函数输出文字类别概率,由此确定输入图像对应内容,可将其表示为

式中,x表示图像数据,表示各层权重,表示各层偏置,ReLU表示激活函数,y表示最终文字类别概率分布。通过大量标注数据对模型进行训练,使其能够准确识别不同书写风格。

1.2作业图像处理

1.2.1二值化处理

二值化处理是将彩色图像或灰度图像转化为仅有黑白二色的图像,以便进行后续处理。本系统在处理作业图像时采用阈值分割,设图像I(x,y)为输入灰度图像,灰度值范围限制在[0,255],选择合适阈值T,则二值化后的图像B(x,y)为

采用自适应阈值法选取阈值,通过计算图像灰度直方图,将图像分为前景与背景,以类间方差最大确定阈值。在操作过程中,设图像灰度级为L,灰度值为i的像素个数为i,总像素数,则灰度值为i的像素出现概率。设阈值为k,前景像素的平均灰度为,背景像素的平均灰度为,类间方差可表示为

式中,。通过查询所有可能阈值,找寻使最大的k值作为最佳阈值T经二值化处理后,作业图像中的文字和背景更为分明。

1.2.2滤波处理

作业图像采集因设备、环境等因素影响会引入部分椒盐噪声和高斯噪声,其干扰会显著影响后续图像识别,所以需进行滤波处理。去除椒盐噪声应采用中值滤波,以该图像中的像素点为中心构建n×n窗口,并将窗口内的像素值按灰

文档评论(0)

std365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档