主题导向之非结构化文本资讯撷取技术 - Association for.PDF

主题导向之非结构化文本资讯撷取技术 - Association for.PDF

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主题导向之非结构化文本资讯撷取技术 - Association for

劉 立 E-mail: jsliu@.tw Abstract. information extraction識 讀 料 論 識 來理 精 率98% 率97% 了理 行 1 論 路 量 流 說濫 亂 利 力 路 利 索(information retrieval) (search engine) 索量 索 不論 索 精度 率(precision and recall)行 濾 讀 利 量 力 (information extraction)識 [1] 讀 料理 零年數 聯行 [2] (event template matching)領識理 句 率度不理 立兩識 (knowledge engineering approach) 練 (automatically trainable approach)[3] 識 理 領 立度理 度 識 力度 領練 不來 立練 料練 立 不率練 練 料不易率識 () 便 (Tag) 了識 WIEN[4], SoftMealy[5], STALKER[6], IEPAD[7] 不串理 AutoSlog[8], FASTUS[9] 來說兩不 ()理 利 串 來 不 度句 率 例 不 句 率 率理 度 理 數數料數 了年來領 列 (Message Understanding Conference, Text Retrieval Conference)[10] 年 領 [11][12] [13][14][ 15] 度 度量 論 不 不 利 識 狀 來理 立狀行 異 理句數句 行狀行 利 狀行句識 [16] 了1981年( 70年1)2003年( 92年6) 178810 異 料 數 98% 精度97% 率 論 識 論 論 來 2 異 料 識 行 列 量 料料 來 率聯 料識 精 年 異 令 句料領 例 令 年 館 館 理 行 烈 行 令 年六 李 行連 例 令令 令 句 李行 參句行 參 李 令 句 兩 例 行烈 理 20 30 句 句 A – (appoint) R – (rank) N – (person name) T – (title) B – (as) Q – (reason of dismissal) O – (organization name) D – (dismissal) 句例 ANBORT ORTNQD 句 識 不 句 省略 行 識切句 句行句 識 3 念 料 讀 識 句 理 了流 [2][3] tokenization (word segmentation) → morphological and lexical processing (part of speech tagging, wor

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档