论日语自制写作语料库构建.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
论日语自制写作语料库构建

论日语自制写作语料库构建   摘要:语料库对于大学本科日语写作教学有着辅助性的作用。但日本开发的大型语料库及国内现有的日语学习语料库对大学日语写作的教与学缺乏针对性和可用性。教师可利用学生写作素材及写作教材教辅自制小型写作语料库,并引导学生在写作任务的完成过程中加以合理利用。实验证明,自制小型写作语料库能为学生提供更为真实的语言材料,能有效提高日?Z专业学生写作过程中的词法能力、句法能力、篇章能力及自我修改能力。   关键词:自制语料库;日语写作;词法;句法;篇章法   一、日语语料库的现状   与发展较为成熟的英语语料库相比,日语语料库的建设及相关研究始终相对滞后。日本方面开发的语料库主要有:KOTONOHA「?F代日本?Z??き言?~均衡コ?`パス」、JpWac-L2「学?者用例文コ?`パス」、EDR语料库、京都大学语料库、太阳语料库、日本古典文学全文数据库。而针对日语外国人学习者的语料库有寺村秀夫主持建立的「外国人学?者の日本?Z?`用例の?Ъ??整理と分析」和由日本国立国语研究所建立的「日本?Z学?者による日本?Z作文と、その母国?Z?Uの???Uデ?`タベ?`ス。而中国日语学界开发的语料库主要有中日对译语料库和中国日语学习者语料库CLJC。近年来,语料库被广泛地运用与外语教学理论与实践中,其中,语料库对外语写作教学的帮助也取得了国内外学者的共识。日本学者投野由纪夫、荻野?W男、寺?牒氲馈⒚?D敦子、望月通子等也对日语语料库在语言教育中的作用给予了充分的肯定,如投野(2003)提出语料库在语言教育中的间接运用法与直接运用法,即将语料库运用于教材开发和学习者自主运用语料库进行学习两种方法。寺?敕⒄沽?Tim Johns所倡导的“数据驱动学习法”,即以语料库数据为学习动机驱动的学习方式,美?D(2008)认为学习者若能在使用辞书和语法书的同时使用语料库,那么即使指导者不在也能够自己解决学习疑问。   但笔者认为,现有的日语语料库对中国本科日语专业学生写作能力的培养在存在很大的缺陷,有必要创建专门针对日语写作的语料库,以达到辅助本科日语写作教学的目的。纵观现有的日语语料库,每一个语料库的素材文本都过于单一,如青空文库和新潮文库里所有入选文本均为知名作家的文学作品,EDR语料库和京都大学语料库所有文本均为报纸杂志,国内最大的中日对译语料库也基本只收录了中日著名作家的知名作品,且偏向于小说与散文。这些语料库所采集的文体类型单一,并非严格意义上的均衡语料库。语料库以大量真实的语言作为输入材料的确有利于语言的产出,但“可理解性输入”是一个很重要的习得条件。现有的诸多日语语料库中所收录的文本都大大超出了我国日语初中级阶段学习者可理解与可接收的范围,很难想象日语基础阶段的学习者可以参考原版的日语小说、名家名作、报纸社论新闻评论等并将其词句灵活运用于自己的写作中。而且现有的日语语料库的确均是语篇的简单叠加,缺乏明确的设计理念,存在选择面过窄、类型单一、没有经过系统抽样、缺乏均衡性的问题。结构的不合理、文体的单一化、缺乏良好均衡性和代表性的语料库的都大大限制了其对日语写作教学的辅助作用。   基于以上分析,笔者主张教师可以自建小型日语作文语料库,该语料库专门为日语写作教学量身定制,是教师以学生作文为语言材料构件的学习者语料库。   二、小型写作语料库的制作   (一)数据的收集   笔者收集了14至16年江西师范大学日语系三届大二及大三学生的各类作文,包括作文课上学生所提交的各种体裁的作文、日记、专业四级考试作文、演讲比赛稿等,然后对其进行归类整理。按照随机分层抽样和按比例收集文本的方法,可以确保所获预料的平衡性和代表性。除了从学生的语言使用实例提取文本外,笔者还收集了大量中国和日本所出版的优秀的写作教材、阅读教材如美文诵读、精选晨读等、学生获奖作文优秀作品集,尤其是日本母语使用者中的高中生大学生的写作材料等作为补充。   (二)电脑配置。   数据库的制作需要借助电脑软件来完成。在相应软件安装前需先实现以下电脑配置:1电脑系统设定为Windows? XP以上。在本次课题研究中,笔者使用的是Windows?7系统。2 CPU为Atom,或Celeron,或Core皆可。笔者使用的是Atom。3电脑内存为1GB以上。4在语料库的制作过程中,许多软件的运营都需要Java的支持,所以必须下载并安装最新版的Java。   (三)文本格式转换   笔者所收集的数据基本为WORD文本格式,而语料库制作软件无法识别该种格式文件,所以需要利用批量格式转换软件将文本转换为所需要的TXT纯文本格式。这种文本格式转换软件有很多,笔者使用的是日本「有限会社サイト?`企画」开发制作的文本文件的书写和编辑软件「秀丸エディタ」,。   (四

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档