语料库中的插入语标注的探究.pdfVIP

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语料库中的插入语标注研究 安娜1,侯敏2 (1.中国传蝉大学应用语言学系,北京100024:2.中国传媒大学应用语言学系,北京100024) 摘要;本文通过对。传媒语言语料库”和部分人民U报语料中包含的插入语的分析,比较全面地考察了汉语插入语的使用情况, 并试图按语义类型和语用功能将插入语进行分类,归纳出汉语插入语的主要特点,在此基础上从话语分析的角度确立了话语标记集 来标注插入语。 关键词:插入语;标注;话语标记集 ●’ 。 。 ’ ■■●’ ‘o Kesearch0n I theParentheSiSI n tagng ….q cor·pus AnNal.HouMin2 (1CommunicationUniversityofChina,Bering 100024) the in knewthe ofChinese are Corpus,we parenthesis Abstract:Throughanalyzingparenthesis usage totheir functions.Weconcludedthe featuresofthese Basedonthe classifiedhccordingpragmatic pragmatic parenthesis theory set a annotationmanualfor SOthattheir functionscallbereflected. analysis,Weuppragmatic parenthesis pragmatic manual Keywords:parenthesis,tagging,annotation 1.引言 在加工生语料时,通常的做法是使用分词标注工具对原始语料进行标注。我们采用的是由中国传媒大学应用 语言学系改进后的北大的分词标注系统。在对加工后的熟语料进行校对时,我们发现目前的插入语标记存在一定 的问题。插入语的组成比较复杂,有些是词,有些是词的组合。对由词充当的插入语,北大的分词标注系统把它 当作一个词汇单位米处理,只在句法层面上给插入语一个词性标记,如“据说/v”。对那些由词的组合充当的插 入语,北大的分词系统对每一个组成成分进行了词性标注,如“按~道理/n”。我们认为插入语是在语用平面上 需要研究的内容,应该根据我们的研究目的来决定是否要在词性标注阶段给插入语一个词性标记。 我们认为,插入语可以存在于句法分析之外,它们是不充当句法成分的,提供的只是语用层面的程序信息, 而并不是句法层面的概念信息,对话语命题的真假不产生影响.在话语中的作用主要是语用的而非句法的。囡此, 在我们进行分词标注的过程中,主张不考虑插入语的词性标记,只给出特定的语用标记就可以。但究竟给插入语 词性标记还是语用标记最终还是由分词目的决定的。 自然语言十分复杂,大规模真实文本在处理时存在的噪声很多,想得到一棵完整的句法树很困难。其中,插 入语也属于画树时的噪声之一。插入语的构成非常复杂,在句法分析的过程中我们很难为它在句法树中找出一个 合理的句法位置。因此,我们认为在句法分析的层面可以把插入语排除在句法分析的内容之外,这也可以作为剔 作者简介:安娜(1979-),女.山东青岛,在读博士E-mail.yunxiner07@cue.edu.nn 除文本噪声的一种手段。 2.插入语的研究 插入语是独立语中的一种。在独立语研究领域中,由于研究的出发点和侧重点不同,出现了各种名称,如: 独立成分、独立语、插说等等(本文研究的“插入语”只是独立语的一个组成部分)。以往的研究成果主要集中 在独立语的性质、独立语的语义分类、独立语的功能这三方面。由于插入语是独立语的下位分类,因此插入语继

您可能关注的文档

文档评论(0)

youyang99 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档