- 6
- 0
- 约5.11万字
- 约 51页
- 2019-06-02 发布于江苏
- 举报
特征选择方法对英文作文自动评分性能影响的研究 第一章引言
第一章帚一早 亏l引言i
1.1本文研究的背景和意义
目前,自动作文评分(Automated
Essay
言处理研究中的热点问题。英语作文的评分是英语教学的薄弱环节,尤其表现在作文
的评分标准上。在目前大部分客观题已能够进行系统的自动评分,如:选择题、填空
题、判断题等。但是对英语作文进行评分的主观性比较强,目前的人工评分有一定的
欠缺。目前采用的评分方法是总体等级评分,由阅卷员阅卷并给予打分。这样的评分
的方法,不仅浪费人力和财力,而且极受到评分者的喜好、习惯、情绪等多种主观因
素的干扰,从而肯定会一定程度上会造成评分时的误差。因此,最大限度地降低乃至
排除主观性试题评分的主观性,实现客观有效而又快捷迅速的自动作文评分系统是势
在必行的。在国内,由于大学英语教学面临着学生人数众多的压力,因此通过借助自
动作文评分,将有望突破写作批改量大、难度大的瓶颈,为教学双方带来切实的帮助。
同时,也有利于为大规模英语考试如大学英语四、六级考试的作文阅卷带来更大的便
利性和准确性。尽管作文自动评分技术受到一些业内人士的质疑,但已在大规模考试
如GMAT、托福等国际性英语考试和学生自我评估中得到了广泛应用。例如:麦格劳
TM
2.0是一种可以帮助学生提高英
-希尔集团加州考试中心推出的WritingRoadmap
语水平的在线教学辅助工具。其包含的自动打分和报告系统根据学生在思想与内容、
逻辑和组织、论调、词汇选择、语言基础和流利度等六个方面的表现快速完成作文评
价。
自动作文评分就是利用计算机技术对作文进行评估与记分【l】,其实质就是基于已
准确人工评分的训练作文集的自动文本分类。但其分类标准除内容外,更要兼顾语言
的运用。该方向的研究至今已历时近四十年,在此过程中,采用了统计、自然语言处
理(NLP)、及人工智能等方面的最新成果【2】,并于1999年进入实际应用阶段。
要实现作文自动评分这一目标,必须解决两大难题【3】。其一是确立能够全面、客
观地反映考生写作水平的作文分项评分标准及各项标准所占的比重,即根据作文评分
第一章引言 特征选择方法对英文作文自动评分性能影响的研究
标准的主要特征,把作文评分标准分解为若干不同的标准项,并按照一定的模式合成
分数;其二是计算机能否根据已经确立的作文分项评分标准自动而准确地从考生作文
中提取出相关信息,这不仅依赖于英语本体研究的相关成果,同时也取决于自然语言
处理技术的发展水平。近几十年来,随着计算机硬件和软件性能快速提高,自然语言
处理等技术获得了长足的发展,国外一批作文自动评分系统相继问世,这两个长期困
扰大规模阅卷的难度有望得到解决。
多项研究证明,在写作评测方面,自动评分系统的准确性与可靠性,以及与人工
评分的一致性方面都是非常高的【4】。这使得自动作文评分成为一项实施可行的研究。
但同时,自动作文评分也存在着很多的缺点。Page强调,计算机不能像人一样评判
一篇作文,因为计算机只是“编程让它做什么它就做什么,而不能像人一样去“欣
赏一篇文章【56】。另外一种批评是构造方面的缺陷。也就是说,计算机所计算的变
量并不一定是作文评分中“真正”重要的方面,比如,评分系统主要关注文章的形式
方面而不是组织方面。
虽然近年来AES在国外已渐成为自然语言处理中的一个热点问题,但大多是针
对英语作为母语作文评分,涉及英语作为外语作文评分的尚不多见。并且英语作为外
语作文自动评分的研究远远滞后于主流的AES研究,而针对中国学生英语作文的AES
研究的成果更是甚微【4】。在中国,每年举行两次的全国大学英语四、六级考试是一项
规模宏大的标准化考试。由于考试阅卷工作量大,所以很难保证阅卷评分的准确性和
客观性,随着参考人数的增多,这一问题日显突出。因此,迫切需要一种客观、准确、
高效的自动作文评分系统来减轻传统的手工作文评判强度。于是,我们的以英语作为
外语的作文评分及相关特征提取的研究很有必要。
1.2本文的创新之处
本课题的创新主要包括以下几个方面:
原创力文档

文档评论(0)