外国语言文学Syntactic Tagging on Modern Chinese Special Sentence Patterns Based on Information Dependency Language Model.pdfVIP

外国语言文学Syntactic Tagging on Modern Chinese Special Sentence Patterns Based on Information Dependency Language Model.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
外国语言文学Syntactic Tagging on Modern Chinese Special Sentence Patterns Based on Information Dependency Language Model

M.A.Thesisof 中文摘要 ChongqingUniversity 摘 要 语料库是语言研究与教学的重要基础,具有重要的应用价值。目前语料库建 设已经从量的积累转向质的提升,如何通过语料标注对语料进行精加工,成为语 料库语言学研究的热点和难点问题。当前大多数语料库的标注还集中在词法层面, 句法标注的规模有限。传统形式化句法理论(例如短语结构语法、依存语法)还 不够成熟,无法应用于语料库中的大规模句法标注实践。信息依存语言模型 (Information DependencyLanguage 面向语料库建设的句法标注理论。该理论整合了短语结构语法和依存语法的描写 能力,借鉴了认知语法的概念自主依存原理,注重语言描写与解释,具有句法语 义一体化的特点。作为一种新理论,在应用于语料库建设之前,需要结合具体语 种对传统句法研究中存在的难点和热点问题进行深入分析,以探索这一理论的适 用性,并初步形成句法标注规范,从而为大规模句法标注奠定理论和知识基础。 现代汉语中存在大量的特殊句式,是现代汉语研究的难点和热点。传统研究 主要从语言学角度对各种特殊句式分别研究,一直以来争议不断。还没有看到有 人从语料库建设的角度对现代汉语的各种特殊句式进行系统的形式化分析和整 理。本文通过对传统研究文献的梳理,确定了四种有代表性的现代汉语特殊句式, 以IDLM为理论基础进行形式化分析,给出句法标注的理据和表达式。研究目的 在于:一方面验证IDLM对现代汉语的适用性,另一方面完成对现代汉语几种代 表性特殊句式的标注。本文是将IDLM应用于现代汉语语料库建设的预研究。 本文共有五个章节。第一章是绪论,介绍了研究背景、研究内容以及研究的 价值和意义。第二章为文献综述,包括对相关语料标注领域和语言学领域研究现 状的梳理和总结。第三章为理论基础,详细介绍了IDLM理论的原理和句法语义 分析过程。第四章对各特殊句式进行了句素关系分析和IDLM结构分析,并在此 基础上对其进行了句法语义解读。第五章为全文结论。 本文创新之处在于:尝试在充分考察传统语言学研究成果的基础上,以面向 语料库的形式化句法理论——IDLM来研究现代汉语特殊句式,从而有别于相对孤 立的传统语言学研究和传统句法标注研究;通过对几种代表性现代汉语特殊句式 的研究,使IDLM在现代汉语分析方面的应用更加深入;IDLM对某些特殊旬式的 标注不够直观和简洁,本文通过缩写形式予以简洁标记。 通过研究发现:IDLM句法标注理论将句素之间以及句素内部的各种关系呈现 为一个个多元结构,再通过联合或嵌套的方式相互关联,符合人们认知逻辑和行 为经验,方便了计算机对自然语言的学习和语言信息的提取。该理论的提出打破 M.A.Thesisof 中文摘要 ChongqingUniversity 了当前语料标注在词法层面停滞不前的僵局,为语料标注的进一步发展提供了参 考,具有深远的实践意义。 总之,IDLM理论以简洁的信息依存表达式和直观的信息依存图实现了对句法 结构的形式化,其标注结果符合句子的真实语义,对特殊句式具有较好的描写能 力,可供计算机检索使用。这些研究成果为大规模语料库建设作出了准备,是对 传统研究的有益补充。 关键词:信息依存语言模型,现代汉语,特殊句式,句法标注,语料库建设 II ABSTRACT 1s uorpus toolfor aIl岫ponantlanguage it study,andpossesses great application VaIue·I hef

您可能关注的文档

文档评论(0)

yxutcangfp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档