基于SNoW文本中空间表达式的识别与分析-计算机科学与技术专业论文.docxVIP

基于SNoW文本中空间表达式的识别与分析-计算机科学与技术专业论文.docx

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于SNoW文本中空间表达式的识别与分析-计算机科学与技术专业论文

Classified Index:TP391.2 .: 681.37 A Dissertation for the Degree of M. Eng THE RECOGNITION AND ANALYSIS OF SPATIAL EXPRESSIONS FROM TEXTS BASED ON SNoW Candidate:Han Candidate: Han Yanhai Supervisor: Prof. Li Shen Academic Degree Applied for: Master of En Specialty: Computer Sci Affiliation: School of C Technology Date of Defence: June, 2006 Degree-Conferring-Institution: Harbin Institu ence and Technology omputer Science and te of Technology 摘要 空间表达式的识别与分析来源于国家自然科学基金资助项目“基于 Ontology 的文本中空间关系三维可视化”,是该项目自然语言处理部分的第 一步。在空间关系三维可视化的过程中,包括三个步骤:空间关系抽取,空 间关系量化,以及可视化。根据语言学家的相关分析,我们把现代汉语所描 述的空间关系分为两个层次,一个是空间表达式,另一个是射体。其中,射 体是空间关系的主体,而空间表达式描述了射体的空间方位,主要由方位词 和界标组成。 目前,可以借鉴的空间表达式识别方法有两种,基于规则的方法和基于 统计的方法。前者在精度上取得了比较大的成绩,但是这种方法的缺点在于 规则的提取耗费了大量的人力和物力;相反,后者可以有效地减少人力和物 力的投入,同时在语料规模适当的时候,可以取得到的效果也非常接近于甚 至超过基于规则的方法,另外基于统计的方法还具有的较强的泛化能力。 有鉴于以往的经验,本 文提出了一种基于 SNoW(Sparse Network of Winnow)的空间表达式识别与分析方法,并辅以简单的规则,对现实文本中 的空间表达式进行识别与分析。同时,针对《伊索寓言》实现了一个空间表 达式识别与分析系统,该系统取得了一定的成功。 本文的主要研究内容包括如下四个部分: 1. 空间关系语料加工。尽管语言学家对现代汉语在描述空间关系的时 候的特点有了比较详尽的、系统的介绍,但是在计算语言学界,并没有关于 实体间空间关系的语料,为了实际应用的需要,我们首先需要提出一套空间 关系语料标记符号,并针对实际语料(伊索寓言)做加工。 2. 基于 SNoW 学习框架的空间表达式和界标识别的研究。针对空间表 达式在实际文本中出现的特点,我们提出一种基于 SNoW 的空间关系识别 方法,并实现了较好的空间表达式(Spatial Expression)和界标(Landmark)的识 别系统。 3. 本文简要分析了方位词和介词的使用特点,并提出了一种基于规则 的方位词和介词标注方法。 4. 针对空间表达式在文本出现的特点,实现了一个以统计为主,规则 为辅的空间表达式识别与分析系统 关键词 空间关系;空间表达式;SNoW;射体;界标 Abstract The recognition and analysis of spatial expression is an important part of the Nature Science Foundation “the 3D visualization of spatial relationships in text based on ontology”, which includes three parts: the extraction of spatial relation, the quantification of spatial relation, and the 3D visualization of spatial relation. According to the linguists’ analysis, we divide the spatial description into two parts, including the spatial expression and the corresponding trajectory. Trajectory is the focus of spatial relation, and the spatial expression,which is used to describe the spatial position of the trajectory, c

文档评论(0)

131****9843 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档