基于美剧《欲望都市》剧本台词语料库的短语动词检索与口语教学.docVIP

基于美剧《欲望都市》剧本台词语料库的短语动词检索与口语教学.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于美剧《欲望都市》剧本台词语料库的短语动词检索与口语教学

基于美剧《欲望都市》剧本台词语料库的短语动词检索与口语教学   摘要:能够娴熟使用具有习语性的短语动词体现了英语口语的地道性。影视剧本台词文本库中蕴含了大量的习语性短语动词。本文自建了欲望都市台词文本库,运用搜索软件检索出文本库中具有习语性的短语动词,指导如何将检索到的短语动词用于英语口语教学 关键词:文本库;习语;短语动词;数据驱动学习 中图分类号:G642.41 文献标志码:A 文章编号:1674-9324(2015)31-0171-03 一、引言 20世纪90年代初Tim Johns提出了一种基于语料库的外语学习方法(data-driven learning,简称DDL):数据驱动学习。它的主要思想是学生对语料库呈现的批量语例进行观察、推断和归纳,自行发现语言特征和规律。与此同时,Sinclair开创了语料库驱动的短语学,强调词语序列的频数和定量分析(Sinclair 1991)。随着计算机技术的普及,越来越多的教师发现,文本是保存数据的主要形式。对批量文本进行搜索和操作,可以发现文本背后数据的规律性和特征性(詹宏伟 2013)。梁茂成也提出研究者需要特殊语料时,可以自己动手搜集一些文本,建立一个小型的语料库(梁茂成 2010)。鉴于此,数据驱动教学的理念和做法日臻成熟。本研究基于自建的美剧《欲望都市》剧本台词语料库,利用检索软件检索出台词中出现频率最高的前20位短语动词,为数据驱动口语学习的模式打开了一个新的视角 二、《欲望都市》台词剧本与短语动词 美剧《欲望都市》由美国有线电视HBO出品并自1998年开播,连播6年。全剧共六季,94集。该剧自播放以来,深受观众好评,将艾美奖、全球奖最佳喜剧、最佳女主角、最佳女配角等奖项一举收入囊中。故事主要描述了四位现代都市单身女性寻找爱情,体会大都会城市生活的故事。《欲望都市》的剧本台词富有美国大都会职业妇女的动感和时尚气息,成为经典的英语口语学习内容 在英语口语之中,短语动词因其数量众多,语义丰富而成为口语的基本特征之一(陈怡 2009)。可以这么说,在口语中能否熟练运用短语动词对英语口语的地道性有着举足轻重的作用(杨惠中 2005)。从结构上说,短语动词的是由“动词加上介词”、“动词加上副词”或“动词加上副词再加上介词”三种形式构成。从语义上说,同一个短语动词的某些义项可能是习语性的,某些义项则可能不是习语性的(骆世平 2006)。本研究集中关注的是如何检索习语性动词短语并将其用于英语口语教学 三、剧本台词语料库的操作方法 本研究从网络途径收集齐全该剧共六季、94集的英文台词,建成台词文本语料库 1.文本清洁。由于网络途径获得的文本存在各种不合规范的符号和格式,进而影响到检索结果的正确性和可靠性,需要对批量生文本进行清洁与整理。免费软件“文本整理器”专为文本格式整理而编写的,可处理单个或批量文本。打开文本整理器界面,设置所需进行清洁的格式转换,即可对批量的剧本台词文本库进行整理。见下页图1和图2 2.文本赋码。对短语动词进行检索需要借助其语法结构,这就要求对清洁后的文本进行词性赋码。本研究中使用的词性赋码工具是免费软件TreeTagger,利用该软件对所建台词文本语料库进行词性赋码。考虑到一些动词有大量的屈折形式,出于本研究的目的,需要把同一个动词的屈折形式归并到一起,视为同一个词。因此,在用TreeTagger进行赋码时,同时运用该软件对文本库进行词形还原,便可生成如下页图3所示界面 3.检索软件与检索步骤。本研究中所使用的检索软件为免费软件AntConc。该软件由日本早稻田大学Laurence Anthony博士研究开发,是一个语料库文本分析工具。它有七大功能模块:Concordance、Concordance Plot、File View、Cluster、Collocates、Word List、Keyword List,并且支持使用正则表达式进行搜索(何安平 2004)。动词短语的语法构成为“动词加上介词”、“动词加上副词”或“动词加上副词再加上介词”,因此对文本数据词性的检索与分析可以借助正则表达式。经过对Tree Tagger赋码集的观察,三个相对应的正则表达式分别为“\S+_VV\w*\s\S+_IN”、“\S+_VV\w*\s\S+_RB”、“\S+_VV\w*\s\S+_RB\s\S+_IN” 下图4示范了第一种检索方式。通过正则方式搜索出的高亮词组还需要进行人工抽查、检验和校对 4.检索出的动词词组进行频数统计。利用AntConc软件中的Concordance标签,对从第三步检索出的动词词组进行频数统计。输入所要检索的动词词组,点击start键,出现的索引行界面如下图5所示 四、数据分析

您可能关注的文档

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档