网络数据挖考试重点
《Web Data mining》复习与总结
课程主要内容
数据挖掘概述 + WEB数据挖掘
数据挖掘(ch1 概述):又被称为数据库中的知识发现(KDD)。是指从数据源(如DB、文本、图片、万维网等)探寻有用的模式或知识的过程。这些模式必须是有用的、有潜在价值的、并且是可以被理解的。数据挖掘是一门多学科交叉的学科,包括机器学习、统计、数据库、人工智能、信息检索和可视化。
WEB数据挖掘(ch6-12)的目标是从web超链接、网页内容和使用日志中探寻有用的信息。依据挖掘过程中使用的数据类别,web挖掘的任务划分为三种主要的类型:web结构挖掘、web内容挖掘和web使用挖掘。
web结构挖掘:从表征web结构的超链接中寻找知识。Ch6-ch8:信息检索与web搜索;链接分析;web爬取。
web内容挖掘:从网页内容中抽取有用的信息和知识。Ch9-ch11:结构化数据抽取:包装器生成;信息集成;观点挖掘。
web使用挖掘:从记录每位用户点击情况的使用日志中挖掘用户的访问模式。Ch12:web使用挖掘
各章主要知识点
(ch1)概述——主要知识点
万维网、超文本、超链接、超媒体的概念;
HTTP,HTML,URL, WEB,TCP/IP的含义;
Web数据的特点:P5-6;
数据挖掘的定义、数据挖掘任务、KDD过程、KDD的数据类型等;
Web数据挖掘的定义、分类、web数据挖掘过程等
您可能关注的文档
- 第四章 设管理课后题答案.doc
- 第四讲工程题.doc
- 第四节 金的电化学腐蚀与防护.doc
- 第四章商务划文案课堂项目教学.doc
- 第五版物理学第二章习题答案.doc
- 第四章班组量管理.doc
- 第四章金融产总复习题及答案.doc
- 第十五章生与存货循环的审计习题.doc
- 答案 第2练习题.doc
- 管理人员绩考核办法.doc
- 十五五规划下科研仪器与试剂国产化对创新药研发的成本影响.pptx
- 十五五规划下生物防治技术迎来规模化投资窗口.pptx
- 十五五规划下生物医药基因疗法安全性监测投资机遇及体系.pptx
- 十五五规划下医药领域地理因素与区域流行病学的投资指向.pptx
- 合规红线与避坑实操手册(2026)《NBT 11517-2024矿用提升容器重要承载件无损检测方法与判定规则》.pptx
- 合规红线与避坑实操手册(2026)《NBT 11520-2024煤矿井下顺槽刮板转载机用迈步自移装置》.pptx
- 合规红线与避坑实操手册(2026)《NBT 11537-2024煤矿在用卡轨人车检测检验规范》.pptx
- 合规红线与避坑实操手册(2026)《NBT 11540-2024煤和岩石耐磨性测定方法》.pptx
- 合规红线与避坑实操手册(2026)《NBT 11542-2024煤矿巷道笼式锚索底板锚注支护技术规范》.pptx
- 合规红线与避坑实操手册(2026)《NBT 11541-2024顺层定向长钻孔预抽煤巷条带煤层瓦斯区域防突技术规范》.pptx
原创力文档

文档评论(0)