- 7
- 0
- 约2.26万字
- 约 17页
- 2016-10-05 发布于贵州
- 举报
网络数据挖掘考重点
《Web Data mining》复习与总结
课程主要内容
数据挖掘概述 + WEB数据挖掘
数据挖掘(ch1 概述):又被称为数据库中的知识发现(KDD)。是指从数据源(如DB、文本、图片、万维网等)探寻有用的模式或知识的过程。这些模式必须是有用的、有潜在价值的、并且是可以被理解的。数据挖掘是一门多学科交叉的学科,包括机器学习、统计、数据库、人工智能、信息检索和可视化。
WEB数据挖掘(ch6-12)的目标是从web超链接、网页内容和使用日志中探寻有用的信息。依据挖掘过程中使用的数据类别,web挖掘的任务划分为三种主要的类型:web结构挖掘、web内容挖掘和web使用挖掘。
web结构挖掘:从表征web结构的超链接中寻找知识。Ch6-ch8:信息检索与web搜索;链接分析;web爬取。
web内容挖掘:从网页内容中抽取有用的信息和知识。Ch9-ch11:结构化数据抽取:包装器生成;信息集成;观点挖掘。
web使用挖掘:从记录每位用户点击情况的使用日志中挖掘用户的访问模式。Ch12:web使用挖掘
各章主要知识点
(ch1)概述——主要知识点
万维网、超文本、超链接、超媒体的概念;
HTTP,HTML,URL, WEB,TCP/IP的含义;
Web数据的特点:P5-6;
数据挖掘的定义、数据挖掘任务、KDD过程、KDD的数据类型等;
Web数据挖掘的定义、分类、web数据挖掘过程等
原创力文档

文档评论(0)