基于语料库的英语否定前缀构词能力对比研究的中期报告.docxVIP

基于语料库的英语否定前缀构词能力对比研究的中期报告.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

基于语料库的英语否定前缀构词能力对比研究的中期报告

Introduction

本文旨在探讨语料库对英语否定前缀构词能力的影响,并对比不同语言背景人群的表现,对应的中期报告旨在汇报所取得的初步研究结果,讨论研究方法的问题以及未来工作的展望。

Method

本研究的语料库主要是基于COCA(theCorpusofContemporaryAmericanEnglish)。从其中筛选出了否定前缀构词中出现频率较高的前缀un-,non-,dis-,mis-,in-,通过搜索相关词汇(如unhappy,nonviolent,disapprove,misunderstand,invisible等)来收集相应的语料。这些语料随后被分为两个部分:一部分用于构建训练集,另一部分用于构建测试集。语料中的每个单词都被标记为属于哪个前缀及其词性。训练集用于训练机器学习模型,测试集用于测试模型的预测能力。

为便于研究,我们选取了三个具有不同语言背景的人群来参与本研究,他们分别来自美国、中国大陆以及印度。每个人群中的参与者在语言背景、学习经验等方面存在差异,这样可以从不同的角度对语料库的影响进行探讨。

我们为每一个参与者提供了一个网页界面,界面中随机选取测试集中的一个词汇,并提供这个词汇的上下文(约10个单词)。参与者需要根据上下文,判断这个单词是否以指定的前缀开头,并给出自己的判断结果和原因。

Results

在训练集上,我们训练了一个支持向量机(SVM)模型。在测试集上,我们用不同的评估指标来比较参与者的预测能力。初始的结果表明,模型在测试集上的表现较好,而参与者在不同前缀的判断上存在较大差异。例如,参与者对于non-前缀的判断表现较好,而对于mis-和dis-前缀的判断表现较差,且这种差异在不同的语言背景中表现得更为明显。

DiscussionandFutureWork

本研究的结果表明,语料库可以起到一定的辅助作用,对英语否定前缀构词能力的提高有一定帮助。另外,参与者之间存在较大差异,这可能与他们的语言背景、学习经验等因素有关。

未来,我们将进一步探讨这些差异的原因,并寻找更加精确的评估指标和更适合的模型来提高研究的准确性和可重复性。同时,我们还将招募更多的参与者,特别是母语不是英语的人群,以更好地考察语言背景对于否定前缀构词能力的影响。

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档