语料库语言学与壮语语料库建设.docVIP

语料库语言学与壮语语料库建设.doc

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语料库语言学与壮语语料库建设

语料库语言学与壮语语料库的建设   摘 要: 本文通过介绍语料库语言学的发展与应用,指出了建设壮语语料库的意义,阐述了建设壮语语料库的建议,以及壮语语料库的附码标注,包括标注应遵循的原则,可参考的标注模式和可标注类型,旨在促进壮语语料库的研究与发展。   关键词: 语料库语言学 壮语语料库 建设      语料库语言学是对以语篇语料为基础的语言进行研究的一门学科,也是一种研究方法。四十多年来,语料库语言学不断扩大研究范围,取得了丰硕成果,巩固并提高了自己在语言学界的地位。尤其是运用不断更新的计算机技术建立的语料库,规模大、功能多、检索方便,使语言研究的手段和方法发生了巨大变化,对语言学理论探索也产生深远的影响。近年来在语言学界和言语工程界的共同努力下,我国在汉语语料库和中文信息处理技术方面取得了令人瞩目的进步。我国少数民族语料库和信息技术方面也有了一部分成果。1991年国内出现了“现代蒙古语文数据库”和蒙古文语料库的词类标注系统――AYIMAG。中国社会科学院民族研究所完成了1994年立项的社科基金项目――中国少数民族语言文字多媒体数据库。另外藏文、朝鲜文、壮文、满文等也在操作系统、电子出版系统、数据库建设等方面有了比较大的发展。而在壮语语料库的建设方面,我认为还可以有更好的发展。   一、语料库语言学的发展   语料库语言学在其发展初期并没有引起太大的共鸣。计算机的发展促进语料库建设手段不断实现现代化和自动化,语料库在语言教学和研究中所能发挥的作用越来越大,从语言研究、语言教学、语言测试、词典编纂到人工智能等领域都开始应用语料库。现代语料库语言学开始得到越来越多人的重视。由于语料库搜集了大量的人们实际使用的语言,而且可根据各种研究需要通过计算机快速加以处理,故语料库为语言研究开辟了广阔的研究领域。   语料库语言学开始是以英语作为研究对象的,现在已发展到英、法、德、西、日、汉、蒙语等20多个语种。语料库语言学的发展可分为两大时期:计算机化以前的语料库和计算机化的语料库。计算机化之前的语料库主要有为词典编纂,语法研究收集的引语库,为教学目的收集的文章库,为语言调查收集的方言库。计算机化的语料库可分为三个层次:未加标注的语料库,标有词类附码的语料库,标有句法附码的语料库和标有语音韵律的语料库。   二、语料库语言学的实际应用   语料库语言学的实际应用主要有四个方面。   第一,词典编撰方面。大型语料库对词典编撰极有用处,如《科林斯―科贝尔特英语词典》有自己的大型语料库,《朗文英语词典》所依据的朗文语料库网包含三个子语料库:一是朗文―兰卡斯特语料库,含英美语各种类型的书面语3000万字;二是朗文学生语料库,含世界上唯一的各国英语学习者书面英语语料库;三是英语口语语料库,含第一个日常英语会话语料库。第二,语料库的检索功能和统计手段给句法研究、语篇分析、会话分析和语音研究提供了方便。互联网上现代英语国际电脑文档(I-CAME)介绍了许多近年来以语料库为基础的语言研究项目,说明语料库对于语言研究的重大意义。语料库语言学可以处理一定范围内的语料,揭示语言在某一历史阶段中的情况。第三,语料库语言学对语言教学与外语教学产生了直接的影响。语料库作为大量真实语言资料的来源,近年来在教学中得到越来越广泛的应用。母语习得和外语学习都离不开语料研究。语料库对新闻语言、科技文本等特殊用途语言的教学与研究也起了很大作用。第四,翻译研究语料库翻译研究是20世纪90年代才兴起的一种全新的翻译研究模式。适用于翻译研究的语料库主要是平行语料库和可比语料库。语料库翻译研究取得的较突出的成就是对翻译普遍性的研究。关于译文中存在的简略化,明确化和规范化的普遍特征的假设在语料库翻译研究中得到了一定程度的验证。   由于语料库在数据统计等方面的强大功能,它也被广泛应用在其他领域,如基于口语语料库数据对口语和书面语进行对比研究,对口语词汇、口语语法和会话中的词块使用特征、话语结构特征的描述,利用平行语料库研究英汉互译和语言测试问题,等等。   三、建设壮语语料库的意义   从语料库语言学的发展和语料库的应用中,我们看到少数民族语言的语料库的建设对于少数民族的语言研究是有意义而且必要的。近年来国内专家学者对壮语的研究取得了进展。为了使壮语研究者更加方便地进行壮语语言的描写,方言比较研究和壮语和其他语言的历史比较研究,以及壮语词典的编撰、壮语语料库的建设是非常有必要的,其重要意义可归为以下几点。   第一,语料库可以广泛地集录语言资料,最大限度地保存、保护语言资料,保存具有社会历史价值的语言文化遗产。在社会文化生活发生巨大变化的今天,不少语言日渐衰微,乃至面临消亡的危险,没有被很好地记录。尽管壮语没有面临濒危境地,但存在汉化现象,因此壮语语料库的建

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档