网络数据挖掘考重点.docVIP

  • 7
  • 0
  • 约2.26万字
  • 约 17页
  • 2016-10-05 发布于贵州
  • 举报
网络数据挖掘考重点

《Web Data mining》复习与总结 课程主要内容 数据挖掘概述 + WEB数据挖掘 数据挖掘(ch1 概述):又被称为数据库中的知识发现(KDD)。是指从数据源(如DB、文本、图片、万维网等)探寻有用的模式或知识的过程。这些模式必须是有用的、有潜在价值的、并且是可以被理解的。数据挖掘是一门多学科交叉的学科,包括机器学习、统计、数据库、人工智能、信息检索和可视化。 WEB数据挖掘(ch6-12)的目标是从web超链接、网页内容和使用日志中探寻有用的信息。依据挖掘过程中使用的数据类别,web挖掘的任务划分为三种主要的类型:web结构挖掘、web内容挖掘和web使用挖掘。 web结构挖掘:从表征web结构的超链接中寻找知识。Ch6-ch8:信息检索与web搜索;链接分析;web爬取。 web内容挖掘:从网页内容中抽取有用的信息和知识。Ch9-ch11:结构化数据抽取:包装器生成;信息集成;观点挖掘。 web使用挖掘:从记录每位用户点击情况的使用日志中挖掘用户的访问模式。Ch12:web使用挖掘 各章主要知识点 (ch1)概述——主要知识点 万维网、超文本、超链接、超媒体的概念; HTTP,HTML,URL, WEB,TCP/IP的含义; Web数据的特点:P5-6; 数据挖掘的定义、数据挖掘任务、KDD过程、KDD的数据类型等; Web数据挖掘的定义、分类、web数据挖掘过程等

文档评论(0)

1亿VIP精品文档

相关文档