主题导向之非结构化文本资讯撷取技术.pdfVIP

主题导向之非结构化文本资讯撷取技术.pdf

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主题导向之非结构化文本资讯撷取技术

劉 立 E-mail: jsliu@.tw Abstract. information extraction識 讀 料 論 識 來理 精 率98% 率97% 了理 行 1 論 路 量 流 說濫 亂 利 力 路 利 索(information retrieval) (search engine) 索量 索 不論 索 精度 率(precision and recall)行 濾 讀 利 量 力 (information extraction)識 [1] 讀 料理 零年數 聯行 [2] (event template matching)領識理 句 率度不理 立兩識 (knowledge engineering approach) 練 (automatically trainable approach)[3] 識 理 領 立度理 度 識 力度 領練 不來 立練 料練 立 不率練 練 料不易率識 () 便 (Tag) 了識 WIEN[4], SoftMealy[5], STALKER[6], IEPAD[7] 不串理 AutoSlog[8], FASTUS[9] 來說兩不 ()理 利 串 來 不 度句 率 例 不 句 率 率理 度 理 數數料數 了年來領 列 (Message Understanding Conference, Text Retrieval Conference)[10] 年 領 [11][12] [13][14][ 15] 度 度量 論 不 不 利 識 狀 來理 立狀行 異 理句數句 行狀行 利 狀行句識 [16] 了1981年( 70年1)2003年( 92年6) 178810 異 料 數 98% 精度97% 率 論 識 論 論 來 2 異 料 識 行 列 量 料料 來 率聯 料識 精 年 異 令 句料領 例 令 年 館 館 理 行 烈 行 令 年六 李 行連 例 令令 令 句 李行 參句行 參 李 令 句 兩 例 行烈 理 20 30 句 句 A – (appoint) R – (rank) N – (person name) T – (title) B – (as) Q – (reason of dismissal) O – (organization name) D – (dismissal) 句例 ANBORT ORTNQD 句 識 不 句 省略 行 識切句 句行句 識 3 念 料 讀 識 句 理 了流 [2][3] tokenization (word segmentation) → morphological an

文档评论(0)

sunshaoying + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档