网络语料库分析系统CQPweb建设及应用.docVIP

网络语料库分析系统CQPweb建设及应用.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络语料库分析系统CQPweb建设及应用

网络语料库分析系统CQPweb建设及应用   摘要:新一代网络语料库分析系统CQPweb具有词频分析、搭配分析、分布分析、索引行以及主题词分析等多种分析功能。CQPweb于2014年首次引入国内,目前国内已建成三个CQPweb,更多语料库研究者期待着创建自己的CQPweb。鉴于此,本文以HZAUCQPweb为例,详细介绍了CQPweb的创建流程,所要求的环境条件、技术要求、CQPweb的体系结构、管理权限等。HZAU CQPweb建成后,被应用于学术写作教学,探讨了CQPweb的三个主要分析功能,即词频、搭配、分布分析功能在解答写作困惑方面的作用。应用研究揭示:基于CQPweb的数据驱动学习在提高学生的语言意识、促进主动学习和知识内化等诸多方面优势凸显。本研究旨在促进CQPweb在国内的推广应用。   关键词:CQPweb;平台建设;数据驱动学习;学术写作教学   一、引言   近年来,随着计算机技术的进步,语料库开发与建设迅猛发展。然而技术门槛与版权问题阻碍了语料库资源的共享。最新一代网络语料库分析系统CQPweb极大地简化了语料库检索操作,很大程度上消除了技术障碍。同时,CQPweb将语料库文本储存于网络服务器,用户无法复制或重构语料库文本,使语料库版权得到保护。因而,有很多语料库研究者期待架构自己的CQPweb,上载自建的语料库,用于教学与科研。鉴于此,本文以HZAU CQPweb为例,介绍CQPweb的建构流程及其应用。集易用性、兼容性与强大功能于一体的CQPweb特别适合数据驱动学习(data-driven learning)。在教学中采用CQPweb,引入数字驱动学习的教学理念,将促进教学方法、教学手段的更新。CQPweb充分利用数据索引,能对大规模文本进行快速处理,符合大数据时代特征,代表着今后语料库分析工具的发展趋势。   二、概述   1.cQPweb的发展历程   CQPweb是第四代基于网络的语料库分析系统(McEneryHardie 2012:44),其主要分析功能包括:索引行、搭配、词频、关键词、分布分析等。CQP(Corpus Query Processor)最初由德国斯图加特大学于1994年在Solaris平台开发(Christ 1994)。1998年,StefanEvert以Linux为平台继续开发(Evert 2008)。2006年HoffmanEvert结合了两个单独的查询技术语料库工作平台Corpus Workbench(CWB,CQP为其核心组件)和MySQL关系数据库,产生了新一代以CWB/CQP和MySQL为后台的语料库分析系统BNCweb,既提高了系统的操作性能,又给予CWB/CQP一个更友好的用户界面。但是,该系统只能检索英国国家语料库BNC,不兼容其他语料库。为了突破此局限,兰卡斯特大学Andrew Hardie用PHP语言改写了BNCweb,更全面的数据模型使其兼容几乎所有类型的语料库,他将改进后的系统命名为CQPweb。2008年,首个CQPweb问世,它以开源软件形式发布,此后不断推出新版本。   2.cQPweb的优势特征   CQPweb采用浏览器一服务器的分布式数据处理方式,能实现跨平台检索,在功能性、易用性、灵活性三个方面实现了重大突破。Hardie认为对语料库兼容并收的灵活性是CQPweb的主要创新特点(Hardie 2012:380)。相对于其他语料库分析工具,CQPweb优势突显。目前广泛使用的第三代语料库分析工具,   如WordSmith Tools、MonoConc、AntConc等,虽然拥有良好的图形用户界面,易用性高,但是它们不支持数据索引或复杂检索,因而检索速度和功能大为逊色。还有一些语料库工具虽然检索功能强大,但易用性差。例如德国斯图加特大学的CWB/CQP支持大型语料库的快速、复杂检索,但其检索技术门槛高,多数普通研究者不会使用。另外一些语料库检索工具虽然易用,并且功能强大,但是兼容性差。例如上述BNCweb仅能针对BNC检索,无法加载用户自建语料库。相比之下,CQPweb以常人熟知的浏览器为用户端,采用标准化的语料格式,能加载和检索任意语料,在功能、易用、灵活三者之间取得了较好平衡,成为目前功能最为全面的网络语料库分析系统。   3.国内外cQPweb的开发与应用   在国外,CQPweb以其独特的优势受到用户青睐,目前,英、美、德、西班牙、加拿大等多个国家的大学和研究机构采用了CQPweb,服务于教学和科研(许家金、吴良平2014:12),取得了良好的效果。例如兰卡斯特大学在语料库语言学教学中采用了CQPweb,因为语料库检索操作被大大简化,学生有更多精力聚焦于教学内容本身,因而学习效率得到提高(Hardie 2

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档