- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于链语法英语作文自动评分研究
基于链语法英语作文自动评分研究
摘要:分析研究当前国内外英语作文自动评分系统的研究成果,提出了一种基于链语法(Link Grammar)的能为学生提供实时训练的英语作文自动评分系统。系统首先通过依据Link Grammar对句子分析后的成本向量(cost vector)计算文章的语法权值,其次则利用文章核心词、非核心词熵值和有效句比例来对文章主题分档,最后则是结合语法权值和主题分档结果计算文章分数。测试结果表明,10~15分段作文达到了88.9%的准确率,说明该系统在10~15分段作文具有较好的适应性,同时系统的分析时间也能很好的满足实时性的要求。
关键词:自动作文评分;链语法;信息熵;主题分档;英语教学
中图分类号:TP391 文献标识码:A 文章编号:1009-3044(2014)02-0284-04
作文自动评分 (Automated Essay Scoring,AES)就是利用计算机技术对作文的语言、内容等方面进行评估与打分[1]。由于作文自动评分具有诸如实用性、一致性等突出优点,近年来该方向的研究在国内也逐渐得到外语教学界和自然语言处理界的重视,相关专家学者如梁茂成[2]和葛诗利、陈潇潇[3]等都做了大量的尝试和研究。但与国外相比,国内的相关研究具有明显的探索性和探讨性,研究的针对性和实用性较弱。目前国外在教育考试领域处于实用中的一些AES系统有Project Essay Grader(PEG)、Intelligent Essay Assessor(IEA)、E-rater等。但是,这些系统对于英语作为外语的考生的作文写作帮助和评分是否需要考虑不同的因素尚没有透彻的研究[4]。
此外,尽管国外自动作文评分研究取得了较好的评分效果,但这些研究主要是针对英语母语或者较高水平的英语作为外语的学习者的大规模考试单一题目作文评分,对于我国英语写作教学来说,更迫切需要的是一种能够针对大多数学生英语写作水平,提供多题目实时训练的作文自动评估和反馈系统,这不仅能增加学生英语作文训练的机会,同时也能减轻老师的批改负担。而这也是本文研究的意义和目标。
研究计算机自动作文评分,首先要面对的就是评分标准的形式化问题。当前主要有两种外语作文评分形式:分项评分和整体评分[5]。前者主要是利用机器学习的方法,从大样本中提取某些有效评分特征及其权重用于未评分作文的评分,如国外E-rater的开发人员提取文本特征建立回归方程,进行线性回归,得到了与人工评分较高的相关度[6]。国内的如梁茂成教授等[7]。而后者则是按照写作理论细化评分标准,提取内容和语言使用方面能够形式化的评分特征,同时分配各特征在作文评分中的权重,如曾用强的过程化作文评估[8]以及葛诗利面向大学英语教学的通用计算机作文评分和反馈方法研究[9]。由于前者依赖于大样本的机器学习,因而不具有实时性和作文题目灵活多变的特点。因而本文采用后一种整体评分方法,从语法分析和主题内容这两个大的方面来研究和设计实时性的作文自动评分系统。
1 语法分析
对外语写作者,即便是较高水平的外语写作者,如托福考生,自动作文评分与人工评分也会出现统计上的显著性差异[10]。主要原因是传统分析器的语言形式关注的往往是哪些符合语法,而不是哪些不合语法,因而在面对不合语法的输入时,传统分析器显得非常呆板。然而关键是不合语法规范的文章是很多的,特别是对于低水平的英语写作者,即作文中高频率出现词汇和句法方面错误的汉英中介语,传统的语法分析器则会遇到更大的困难,并且其健壮性也面临很大挑战。用来解决健壮性问题的方法之一是制定反映不合语法规范的称之为“不良规则”的编码规则[11]。
在本次研究中,所选择的分析器是由D.Sleator和D.Temperley开发的链语法分析器(Link Parser)[12]。链语法(Link Grammar)不是建立在树结构的基础上,而是将语言知识完全落实到词汇基础上,通过词语的链接(Link)属性,来对句子进行分析。在分析不合语法的输入时,链语法分析器能够跨越句子中不合语法的单词,找到后面的词汇,并连接构成有句法意义的词对,比如:主语+动词,动词+宾语,介词+宾语,形容词+状语修饰语,和助动词+动词等,因而链语法分析器具有很好的健壮性。
2 文章主题
主题打分主要从文章的单词数量和文章切题程度两方面来展开。仿照人工评分时归档的思想,主题评分也按照分档的思路进行。针对文章词数和文章内容,主题评分的分档分两步完成:第一步通过文章的单词数目来归档;第二步则是在第一步基础上,通过文章核心词熵值、非核心词熵值、有效词的比例这三个参数来对文章进行降档。
2.1 单词数目归档
2.2 根据文章内容降档
文章内容是否切题也是
您可能关注的文档
最近下载
- 吉林省中药软片炮制规范.pptx VIP
- 名著阅读《湘行散记》七年级语文上册部编版(共9页).docx VIP
- 《白洋淀纪事》阅读测试题含答案(推荐).docx VIP
- 必考名著《白洋淀纪事》导读+知识点汇总.pdf VIP
- CQJZDE-2008 重庆市建筑工程计价定额.docx VIP
- 人教部编版七年级语文上册名著选读《湘行散记》导读.doc VIP
- 重庆市建筑工程计价定额CQJZDE-2008.doc
- 部编版七上语文名著导读《朝花夕拾》、《白洋淀纪事》、《湘行散记》知识点练习(含答案).docx VIP
- 超星尔雅学习通《大学生劳动教育》章节测试含答案.docx VIP
- 七年级上册名著《湘行散记》知识点+习题(共12页).docx VIP
文档评论(0)