文本挖掘 – 信息提取(IE).pptVIP

  • 34
  • 0
  • 约5.6千字
  • 约 33页
  • 2018-03-23 发布于江苏
  • 举报
文本挖掘 – 信息提取(IE)

文本挖掘 – 信息提取(IE) 参考Jaime Carbonell教授讲稿 文本中信息的提取 出发点:从文本中挖掘信息,而不是简单的词项匹配 上下文无关实体的提取 Context-Free Entity Extraction 基于规则的实体提取 关系提取(Relational Extraction) 在eBusiness中的应用 Text Mining (1) 文本本来是给人读的,不是计算机 大多数信息以文本形式存储 100 times as much online text as online DBs HTML网页是带有结构标记的文本(带来机会和挑战) 数据挖掘操作的是数据表 (i.e. numbers, fixed fields, adherence to data models). Text Mining (2) 许多应用,我们需要从文本到数据库表的转换器 一般的自然语言理解问题依然太困难 但我们能够解决简单些、同时也有用的子问题吗? Yes! 对文本按照主题分类 并且从文本中或者标记结构文字中提取某些信息是可能的。 Text Mining (3) Components of Text Mining(基本策略) 按照主题(话题,topics)分类 今天稍提一下,以后专门有一讲 从分类的文本中提取事实(本讲主要内容) 在数据库或者提取的事实中进行信息挖掘 Text Cat

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档