基于语料库的英语程式语韵律特征研究.docVIP

下载本文档

7
0
约 12页
2017-03-16 发布于北京
举报
版权申诉

基于语料库的英语程式语韵律特征研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

基于语料库的英语程式语韵律特征研究.doc

基于语料库的英语程式语韵律特征研究 [摘要]语料库语言学研究表明，程式语在英语本族语者日常话语中普遍存在。程式语是使本族语者话语准确、流利和地道的重要因素。然而，相对来说，很少有人关注程式语的韵律问题。基于一个标有韵律信息的语料库，对三词及以上程式语的调群分布和调核重音模式进行考察，结果发现：程式语约70%的情况下至少与调群的一端对齐；就位于调群末尾或占据整个调群的程式语来说，约70%的情况下其调核重音落在程式语的末尾实词上，有些程式语没有接受调核重音，还有些程式语其调核重音落在首词、程度词或其可变空槽上。 [关键词]程式语；韵律特征；调群；调核重音；语料库 [中图分类号]H311[文献标识码]A[文章编号]2095-3712（2016）01-0139-04 一、引言程式语是语言学研究发展最快的研究领域之一。近些年来，程式语引起了语言学各分支学科的关注，因为它对很多理论提出了挑战，这些理论均建立在单词是语言分析和处理的基本单位这个假设上。相关文献中，程式语被赋予诸多不同的名称（关于程式语的术语和定义问题，参见李更春的《程式语的术语和定义问题研究》[1]）。然而，学界尚未就这些术语的确切含义及相互区别达成一致，所以各项研究往往只给出其选用的术语的定义。本文使用“程式语”[2]9这一涵盖性术语来指称所有预制性的单词组合，即不是纯粹基于语法规则逐词产出的单词组合。基于语料库的研究表明，程式语在日常话语中是普遍存在的。[3-6]然而，相对来说，很少有人关注程式语的韵律问题，因此这是一个有待探究的研究课题。本研究旨在通过一个标有韵律信息的语料库（以下简称“标韵语料库”）来探索调核重音在程式语中的分布情况。具体来说，本研究旨在回答三个问题：1.程式语是否常与调群对齐；2.程式语是否常接受调核重音；3.根据英语的韵律规则，当程式语应该接受调核重音时，该重音将落在何处。二、研究方法（一）语料库的选取标有韵律信息的口语语料库非常少，因为韵律标注是一件非常费力且代价不菲的工作。迄今为止，国际上一些知名的标韵语料库有LLC、IViE、HKCSE、SBCSAE、Switchboard Corpus和SEC（IBM/Lancaster Spoken English Corpus）等，这些语料库标有不同类型的韵律信息。例如，LLC给出了调群切分、调核重音和音高变化信息；SBCSAE给出了调群切分和时间数据，但没有提供调核重音和音高变化信息等。因此，这些标韵语料库适用于不同的研究问题。在以上标韵语料库中，本研究选择了SEC，一是因为SEC提供了原始的录音文件，二是由于SEC的韵律标注更加全面。该语料库不仅标注了调核重音、调群切分和音高变化等信息，还提供了精确到音素水平的时长信息。可以说SEC是韵律标注最为详细的语料库之一，也是研究英语韵律最丰富的资源之一。（二）程式语的提取为了提取SEC中的程式语，本研究使用Rayson的语料分析工具Wmatrix。[7]该工具在对语料进行词性和语义赋码后，将按其预设的约1.9万个程式语模板在语料中进行搜索。这样做的好处在于它可以灵活应对程式语在形态、句法和构成上的变化。此外，由于标韵语料库的词容一般较小，如依赖单词共现频率来识别程式语的话，其识别结果的可信度就会受到很大的影响，而按照预设的程式语模板对语料进行搜索恰恰可以避免这一缺陷。首先，研究者运用Wmatrix对SEC中的程式语进行自动提取。在词性和语义赋码后，Wmatrix提取到1580个不同的程式语，其长度从二词到五词不等。由于本文主要探讨三词及以上的程式语，因此二词搭配不进入随后的研究和讨论。这样一共得到380个三词及以上的程式语。随后，研究者对这些程式语进行人工筛选，剔除表示时间、地点或数量的单词串，以及一些专有名词和复合名词。最终，本研究得到218个三词及以上的程式语，它们在语料中共出现339次。研究者从语料中人工提取这些程式语所在的索引行，根据程式语在调群中的位置，对这些索引行进行分类。三、研究结果为了回答程式语是否常接受调核重音的问题，首先要考虑程式语在话语中的位置。这是因为词项的韵律与其在话语中的位置有着紧密的联系，例如调群的开头一般音高较高，节奏较快；而调群的末尾音高较低，节奏较慢。[8]就调核重音来说，位于调群末尾的单词要比在调群中其他位置的单词更有可能接受调核重音。这是由于宽焦点是英语中默认的调核重音模式，而且调核重音是从右向左进行指派的。换句话说，只有当调群的尾词被认为不适合接受调核重音的时候，其左侧单词才有可能被考虑来接受调核重音。由于英语韵律存在这种位置上的偏向，因此只有结合程式语在调群中的位置来考察其调核重音才是有意义的。表1显示了从SEC提取的339例程式语在调群中的位置分布情况。表1程式语在调群中的位置分布情