网站大量收购闲置独家精品文档,联系QQ:2885784924

中文文本中时间信息解析方法.pdfVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文文本中时间信息解析方法.pdf

第30卷第6期 地理与地理信息科学 V01.30No.6 Science November2014 2014年11月 andGeo-Information Geography issn.1672—0504.2014.06.001 doi:10.3969/j 中文文本中时间信息解析方法 张春菊h2,张雪英2,李明2,王曙2 (1.合fIEZ_业大学土木与水利工程学院,安徽合肥230009;2.南京师范大学虚拟地理环境教育部重点实验室.江苏南京210046) 摘要:探讨了基于触发词汇和规则模型相结合的中文文本中时间信息解析方法。通过分析、归纳中文文本中时间 信息描述特点,构建时间词汇词典和时间信息描述模式库,设计时间信息抽取、规范化表达和语义推理算法,实现 了中文文本中时间信息的解析。实验结果表明,中文文本中时间信息抽取的准确率、召回率和F1值分别为 75.00%、88.24%和40.54%,为泛在时空信息动态关联更新和实时挖掘分析提供数据源,且通过与空间维数据有 机地、交互地组织,能够实时展现地理现象和事物的时空演化过程、时空分布特征,从而推动地理信息检索、LBS等 地理信息服务向动态化、多维化方向发展。 关键词:时间信息抽取;时间词汇词典;规范化表达;时间推理;中文文本 中图分类号:P208 文献标识码:A 文章编号:1672--0504(2014)06--0001--06 式的概念,实现单个时间要素信息的识别[10’11]。其 0引言 地理信息以时空为线索,表达地表物体和环境 用代表。在时间要素抽取的基础上,通过定义汉语 固有的数量、质量、分布特征、联系和规律,包括空间 描述中时间关系类型,解析时间表达式的内部规则 定位、几何、时间、时空关系、属性(物理、化学、生物 实现时间短语的归一化表达[】引。然而时间信息描述 等)和语义信息一H。其中,时间信息贯穿于事物发 的省略、指代、模糊等现象无法有效实现规范化表达 生、发展、消亡的整个过程中,反映地理实体的状态 和推理。近年来,基于地理位置服务需求的飞速增 和演变过程[2]。自然语言是人类空间认知结果最基长,文本数据源中地理信息受到GIS领域学者的广 本、最直接、最方便、最常用的表达方式,成为最基 泛关注,其侧重于地名实体、空间关系等空间语义角 础、最重要的地理信息来源和最有潜力的人机交互 色的识别丑卜b],抽取方法包括地名词典匹配、地名 手段。驯。文本是应用最广、普适性最强的自然语 词典和规则模型相结合、基于统计模型的机器学习 言,可在数据的丰富性、表达的直观性、认知的习惯 方法一16‘17。。基于空间信息识别结果,部分学者开展 性和应用的普及性等方面,与矢量、栅格、影像等空 了定性地名实体的空间语义消歧及其与地理坐标的 间数据形成优势互补。全球技术研究和咨询公司调 映射方法[18I,从而建立与GIS的空间语义关联。然 查报告显示,未来10年中至少95%的人机交互信息而,文本中蕴含的丰富时问信息一直处于被忽略的 是文本语言,而80%以上的文本中涉及地理信息的 状态,只是描述数据的一个瞬态,不具有处理数据的 描述一引。特别是随着互联网技术的快速发展,海量 时间动态性。 的网页文本成为承载地理信息的重要媒介,如新闻、 本文通过归纳总结中文文本中时间信息描述 博客、论坛、统计表格、Wiki等。 特点,构建时间词汇词典和时间描述模式库,设计 在自然语言处理领域,基于文本理解、信息检 时间信息规范化表达和语义推理算法,实现时间信 索、问答系统等研究和应用需求的驱动,文本中时空 息的解析,并以地震事件为例,基于已有空间信息 信息抽取研究侧重于人名、地名、组织结构名等独立 抽取方法,分析了时间信息解析的应用。本文研究 的要素单元,以及雇佣关系、上下级关系等简单实体 能够为泛在时空信息动态关联更新以及时空信息 实时挖掘分析提供数据源;同时,通过时

文档评论(0)

kfigrmnm + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档