信息提取技术概述_中_.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
·语言信息处理 · 信 息提取技术概述 ! 中 ( ) ’ 孙 斌 北京大学 () ! #$$%’(%)’*+ *, -+,*$%)’*+ ./)%0)’*+ 1 ! # $% ” 四、信息提取中若干基础性问题 指定的信息 是信息时代人们的一个自然愿 由于文本信息提取是一个富有挑战性和 望,由此可以突破信息检索的局限性,将由人 探索性的课题,对许多相关问题的认识以及求 来阅读、理解、提取信息的过程变成由计算机 解需要长期研究、不断积累。这里只讨论了其 自动查找、匹配和提取信息的过程,从而实现 “ ” 中几个比较重要的方面,包括:信息提取作为 有限技术的无穷运用 。不过在这个简单的模 一门应用技术的目标和核心策略;从信息论的 型中有许多问题是需要认真研究的。首先要明 角度理解信息提取过程的要素,以及信息提取 确的一点是:这门技术究竟是用于做什么类型 的信道模型。 的事情、它又能做什么和不能做什么事情。 $% 关于信息提取的目标、问题及其核心对 我们对此的一个认识和体会是:并非任何 策 形式的信息都是可以自动提取的;实际上,由 根据前面的说明,我们可以把整个信息提 于计算能力和语言资源的限制,可以提取的信 ( ) 取概括为以下一个基本流程,见图$。 息类型是 非常 有限的。因此在研究信息提取 技术的过程中,树立一种实用的态度是必要 () 指定 的 文档库 填好的模板 的。尽管人们的信息需求是无限多样的,我们 信息提取 不能漫无边际地对任何一个实际的信息提取 “( ) ” “ ” 系统提出 百科 知识理解 或 人机对话 那 样不受限的任务,而是应该从实际应用的角 度,细致地考察自己对信息提取的目标要求, ( 并且明确对于当前的技术和资源水平而言,哪 作为一种 数据库接口) 些类型的信息提取任务是可行的、有效的,哪 图 $ 些是困难的、不切实际的,从而使得信息提取 这门技术能

文档评论(0)

sdfgrt + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档