- 1、本文档共64页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于plsa的大学英语作文自动评分模型研究-信号与信息处理专业论文
I
I
摘 要
摘要
英语作文自动评分是计算机技术和人工智能技术迅速发展的必然趋势。同时自然 语言处理技术使得人类能够与计算机之间有效的沟通,这就使对作文自动评分系统的 研究更加有理论基础及可行性。显然,相对于人工评分除了可以减轻教师的负担外, 英语作文自动评分更加客观公正、有统一的评分标准、高效的特点。因此,英语作文 自动评分是具有实际意义的研究课题。
本文主要以全国大学英语四级和六级考试为背景,对参加全国大学英语四级和六 级英语考试学生的作文进行评分。在语料的准备工作中,样本集是由作文的范文组成
的,而不是各个分数段的作文,这就减轻了教师在评分前的准备工作。比较潜在语义
分析与概率潜在语义分析的优劣,最终利用概率潜在语义分析技术对英语作文的内容 进行分析,即语义评分。在原有的概率潜在语义分析的基础上,对传统权重公式加入
了文档全局权重,并利用改进的权重公式对语义空间进行改善,从而提高英语作文内
容质量的评估的精度。本模型还对英语作文的语义连贯性和可读性进行了分析,并对 作文的浅层次语言学特征进行了统计,例如:单词数、句子数、复杂词数等。最终,
利用内容质量、语义连贯性、可读性和浅层次语言学特征对英语作文进行综合评分。
通过待评分作文的机器得分与人工评分的比较,实验结果表明本模型是可以胜任 评分工作的,并且利用概率潜在语义分析技术和改进的权重公式对改善最后的评分结
果是有效的,同时概率潜在语义分析减少了构建语义空间的时间。
关键词:英语作文自动评分;潜在语义分析;概率潜在语义分析;改进的权重公式; 语义评分;
I
II
Abstract
Abstract
Automatic English Essay Scoring is the inevitable trend of the rapid development of the computer technology and the artificial intelligence technology. At the same time, human beings can communicate with the computer through Natural Language Processing technology, which makes the Automatic English Essay Scoring research more theoretical basis and feasibility. Obviously, compare to the Artificial grading besides can reduce the burden of teachers; the Automatic English Essay Scoring is more objective and fair, unified scoring standards, and efficient characteristics. Therefore, the Automatic English Essay Scoring is the practical significance of research into the subject.
The paper is mainly by the College English Test Band Four and Band sixfor background, score essays of the Chinese university students who participate in the Test. In the preparation of the corpus, sample set is composed by the model essays, not all the score band of the essay, sothe preparation burden for scoring of the teacher is reduced. Compare the advantages and the disadvantages of the probability latent semantic analysis and the latent semantic analysis; finally we use probability latent semantic analysis technology to analyze the content of English essay, named semantic score. On the basis of the original probability
您可能关注的文档
- 基于pci总线的数字录音系统的设计与实现-电路与系统专业论文.docx
- 基于pic单片机的煤矿智能监控系统-检测技术与自动化装置专业论文.docx
- 基于prony法的电力系统低频振荡分析与控制-电力系统及其自动化专业论文.docx
- 基于p2p网络的分布式存储系统缓存策略研究-计算机应用技术专业论文.docx
- 基于powerlink工业实时以太网多接口智能网关的设计与实现-仪器仪表工程专业论文.docx
- 基于raroc模型的国有商业银行风险管理研究-技术经济及管理专业论文.docx
- 基于lvs负载调度器的双机热备份研究与实现-计算机应用技术专业论文.docx
- 基于obd-ⅱ的远程车载诊断及定位技术研究-集成电路工程专业论文.docx
- 基于pzb模型的深圳日海公司服务质量策略研究-工商管理专业论文.docx
- 基于pci总线的fpdp数据传输卡的研究-信号与信息处理专业论文.docx
文档评论(0)