一种词汇量测试算法研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种词汇量测试算法研究

一种词汇量的测试算法研究   摘要:随着社会的发展标准化测试的出现,对标准化测试的科学性要求越来越高,测试的质量评价对教学管理和教学计划至关重要。词汇量的测试在语言教学中可以帮助老师很好的了解学习者词汇知识的掌握情况,对教师的教学提供很大的帮助,该文对词汇量评估计算与预测方法,提出了一种实践评估模型。   关键词:语言词汇;测试;算法   中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)14-0248-03   1 研究背景及意义   一种语言包括语言知识和语言技能,词汇知识就在一定程度上就是代表语言知识,词汇不仅是语言的基础,这是衡量一个学生英语学习水平的一个不可或缺的重要指标。由于词汇量的掌握程度可以反映学习能,所以词汇学习与教学、词汇的测量这个研究方向备受国内外研究者的关注,其中研究学习者的语言词汇定量测试的研究最受研究者与教学的关注。   对语言词汇研究的方向很多,例如对词汇量的测定方法也很多。其研究的重要性也是多方面的:语言词语的定量测试可以促进学习,帮助教师更准确的了解学生词汇发展的水平,有助于老师改进教学方向。通过这种定量的检测,可以帮助老师更好地了解学习的语言基础,更好地掌握学习者的学习情况,有助于老师改进和提高教学水平,这也是老师区别基础好的学生与基础不好的学生的一个重要手段。   词汇量测量是国际间跨文化研究的重要方法。所以,要想针对学习者的语言知识和语言能力进行测试,就必须对学习者的语言词汇水平进行测试,语言词汇的测试结果可以间接的反映学习者的语言知识水平。到目前为止,国内外的研究者已经提出很多的测试方法,也有了一些比?^成熟的测试理论。不过关于语言词汇量的测试定量研究有一个明显差异。首先,测定的结果差异性很大;其次,使用的基础语料库的不同,以及使用的特种值不同;有的需要测试大量的语言词汇才得出结果,而且需要测试的覆盖范围比较大,测试的时间比较长。即便是对同一语言水平的测试者进行词汇量调查,不同的测试手段对同一个测试者测试的结果差别也很大。这就是本文提出的用少量语言词汇测试测试出一个较为准确的水平,提出一个探索似的测试算法理论。不过这个算法的正在逐步的实现,我自行设计的《一种语言学习及智能测试平台V1.0》就是对这个算法的系统实现,而且本系统已经得到国家版权局的著作权的登记,目前该软件在我们学校部署给学生使用。测试的结果数据为后续算法的改进提供大量的数据支持,对以后的语言词汇测试的算法探索提供重要的数据。   2 相关理论及数学模型的创建   本文主要的研究内容就是提出基于关联性模型的词汇测试算法,对目前语言词汇定量测定工具中的理论数学模型的讨论。文章中提出的关联性模型就是马尔可夫链模型。马尔可夫链就是描述了某一个结果的产生,取决于它前面的有限个状态[1] 。已经测试过的多个词汇的特征值决定下一个测试词汇的特征值的出现,也就测试的下一个词的特征值关联了它前面的多个词的特征值。   语言词汇的定量测试首要的工作就是选取一个恰当的词汇库,不是语言中的所有词汇都可以作为测试样例。除此之外,还要参考国内外的研究者的一些研究成果相结合,以及一个区域的教学水平和教学习惯相结合。选择语言词汇库的方法目前常用的有两种,一种是词典法;另一种是使用词汇频率表法。词汇频率表是依据词频表选择一定频率的词来测试。通常情况下,人会先记住使用频率高的词汇 [2],人们对低频率词汇的使用少,所有不容易记住。这就是语言词汇频率对学习者的学习影响的一个因素,对不同使用频率的词汇有着明显的差别。因此,学习者对各语言词汇使用频率等级的词汇掌握情况可以反映出他对该语言知识的掌握情况。中国教育部对语言词汇的大纲要求,尤其是对中小学英语词汇的要求,可以大概的统计出英语词汇的使用量在1.3万左右。本文中提出的语言词汇的测试就以英语词汇作为测试样例。 英语语言词汇库的选择是根据《英国国家语料库》得出的使用频率最高的2万个词汇[3]。从这个语料库中在进行部分的筛选就精简后得到本文中使用的词汇库。例如:同一个词的不同属性的词,选取它的名词形式就可以。这样对语料库进行筛选后剩下大概1.5万个词汇。本文使用的语言词汇库就是这1.5万个词,并把剩下的词汇库进行难度级别的划分,划分为10个难度级别。   对测试语言词汇建立数学模型设,假设被测试词汇的使用频率特征值记作[idn (n∈N?)],就是词汇的词频作为特征值。词汇的测试状态记作[Fn (n∈N?)],其中对象特征值为[idn]对应的词汇测试为[Fn=1],表示测试正确,否则记记[Fn=0];测试对象的特征变化值[tn (n∈N?)];表示从[idn]到[idn+1]的变化值;加权值[ζn]; [xn]表示为测试难度系数值;用 [f(x)]来计算特征值,

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档