文本挖掘 - 信息提取(IE)1131.pptVIP

  • 5
  • 0
  • 约5.75千字
  • 约 33页
  • 2018-05-10 发布于湖北
  • 举报
文本挖掘 - 信息提取(IE)1131.ppt

* uouou lijlij * uouou lijlij 文本挖掘 – 信息提取(IE) 参考Jaime Carbonell教授讲稿 * ilujl 文本中信息的提取 出发点:从文本中挖掘信息,而不是简单的词项匹配 上下文无关实体的提取 Context-Free Entity Extraction 基于规则的实体提取 关系提取(Relational Extraction) 在eBusiness中的应用 * ilujl Text Mining (1) 文本本来是给人读的,不是计算机 大多数信息以文本形式存储 100 times as much online text as online DBs HTML网页是带有结构标记的文本(带来机会和挑战) 数据挖掘操作的是数据表 (i.e. numbers, fixed fields, adherence to data models). * ilujl Text Mining (2) 许多应用,我们需要从文本到数据库表的转换器 一般的自然语言理解问题依然太困难 但我们能够解决简单些、同时也有用的子问题吗? Yes! 对文本按照主题分类 并且从文本中或者标记结构文字中提取某些信息是可能的。 * ilujl Text Mining (3) Components of Text Mining(基本策略) 按照主题(话题,topics)分类

文档评论(0)

1亿VIP精品文档

相关文档