- 4
- 0
- 约1.02万字
- 约 39页
- 2017-07-25 发布于湖北
- 举报
数据挖掘原语、语言和系统结构(武汉大学-李春葆)
第4章 数据挖掘原语、语言和系统结构 4.1.1 为什么要数据挖掘原语和语言? 一个完全自动(不需要人为干预或指导)的数据挖掘机器只可能是“一只疯了的怪兽”。 会产生大量模式(重新把知识淹没) 会涵盖所有数据,使得挖掘效率低下 大部分有价值的模式集可能被忽略 挖掘出的模式可能难以理解,缺乏有效性、新颖性和实用性——令人不感兴趣。 没有精确的指令和规则,数据挖掘系统就没法使用。 用数据挖掘原语和语言来指导数据挖掘。 4.1.1 任务相关的数据 用户感兴趣的只是数据库或数据仓库的一个子集。 相关的操作:DB-选择、投影、连接、聚集等;DW-切片、切块 初始数据关系 数据子集选择过程产生的新的数据关系 可挖掘的视图 用于数据挖掘相关任务的数据集 任务相关的数据——例子 挖掘加拿大顾客和他们常在AllElectronics购买的商品间的关联规则 数据库(仓库)名 (e.g. AllElectronics_db)。 包含相关数据的表或数据立方体名(e.g. item, customer, purchases, item_sold)。 选择相关数据的条件(今年、加拿大)。 相关的属性或维(item表的name和price,customer表的income和age)。 4.1.2 要挖掘的知识类型 要挖掘的知识类型将决定使用什么数据挖掘功能。 概念描述(特征化和区分),关联规则,分类/预测,
您可能关注的文档
- 数一数常吃牛肉的10个好处.pptx
- 数值分析(计算方法)第七章.ppt
- 敞开心扉学会沟通上课课件1.ppt
- 数值分析4-06.ppt
- 教科版必修1 .弹 力课件.ppt
- 散文阅读ppt.ppt
- 数值的机器运算.ppt
- 数字信号处理第三章-1.ppt
- 数字信号处理第一章差分方程、抽样.ppt
- 敬畏生命(优质课竞赛).ppt
- 东亚危机中金融传染的研究.docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库含答案详解(a卷).docx
- 三级公立中医医院关于出院病员欠费情况审计报告.docx
- 三级调研员屈全胜个人简历.docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库附答案详解(综合卷).docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库含答案详解(精练).docx
- 2026湖南省交通科学研究院有限公司招聘37人备考题库有完整答案详解.docx
- 三晖电气三季度财务分析报告银行版.docx
- 2026湖南湘江研究院有限责任公司招聘7人备考题库及答案详解(全优).docx
- 2026玉溪硅基智能科技有限公司招聘10人备考题库及参考答案详解一套.docx
最近下载
- 小学数学五年级解方程专项练习题(整数)(每日一练,共11份).pdf VIP
- DY_T 8-2023 数字电影LED影厅技术要求和测量方法.pdf VIP
- 26年东明社区招聘考题真题及答案.doc VIP
- 2015年国际商务单证员(单证操作与缮制)真题试卷(题后含答案及解析).pdf VIP
- 小学数学五年级解方程专项练习题(整数)(每日一练,共21份).pdf VIP
- 2026个人及班子学习教育主要问题清单及整改措施材料(四个方面)共2篇.docx VIP
- 五年级数学(下)期中测试题1.doc VIP
- GB 50300-2013建筑工程施工质量验收统一标准.pdf VIP
- 1-微型消防站器材点检表.doc VIP
- 碳酸盐岩储层沉积学特征.ppt VIP
原创力文档

文档评论(0)