- 16
- 0
- 约 9页
- 2017-08-27 发布于安徽
- 举报
《数据挖掘》复习提纲
第一章 数据挖掘概述
1、什么是数据挖掘
从大量数据中挖掘有用的知识
数据挖掘的动机
数据丰富,信息贫乏
3、数据挖掘的同义词
从数据中挖掘知识,知识提炼,数据/模式分析,数据考古,数据捕捞、信息收获、资料勘探等等
知识发现的过程
1.数据清理2.数据集成3.数据选择4.数据变换5.数据挖掘6.模式评估7.知识表示
5、数据挖掘和知识发现是一回事吗?
数据挖掘是知识发现过程的一个步骤
6、数据挖掘可以挖掘的两类模式?
描述性的数据挖掘,预测性的数据挖掘
7、常用的数据挖掘技术?
概念/类描述: 特性化和区分,挖掘频繁模式、关联和相关,分类和预,聚类分析,离群点(孤立点)分析,趋势和演变分析
什么是离群点?离群点总是被抛弃的吗?
离群点:一些与数据的一般行为或模型不一致的孤立数据。
通常孤立点被作为“噪音”或异常被丢弃,但在欺骗检测中却可以通过对罕见事件进行孤立点分析而得到结论
挖掘的所有模式都是有趣的吗?什么样的模式是有趣的?如何度量模式的有趣度?
一个数据挖掘系统/查询可以挖掘出数以千计的模式, 并非所有的模式都是有趣的
易于理解,在某种必然程度上,对于新的或检验数据是有效的,是潜在有用的,是新颖的,符合用户确信的某种假设
客观: 基于模式的统计和结构, 例如, 支持度, 置信度, 等.主观: 基于用户对数据的确信, 例如, 出乎意料, 新颖性, 可行动性等
您可能关注的文档
- 深化对中国特色社会主义的认识.pdf
- 深刻领会和全面把握科学发展观.ppt
- 深入开展心理素质教育有效促进学生全面发展.ppt
- 神华现代煤制油化工工程建设与运营实践.pdf
- 渗透测试实验平台的开发应用.pdf
- 生产与经济制度 2.ppt
- 生产运作与管理课件text5.ppt
- 生成有效的板支持包.pdf
- 生活经济论文民营经济论文.pdf
- 生物化学工程习题.ppt
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
最近下载
- 髂动脉瘤诊治及进展.pdf VIP
- 中小企业会计成本管理问题与优化策略研究.docx VIP
- 【倍福BECKHOFF】TwinCAT3-TC3_User_Interface_zh_CN 中文手册.pdf VIP
- 产科VTE风险评估量表.docx VIP
- 广东省广州市育才中学2021-2022学年数学高二下期末联考模拟试题含解析.doc VIP
- 丽声指南针英语名著分级读物小学版第三级 The Giant Turnip拔萝卜 课件.pptx VIP
- 髂动脉瘤的诊治现状.doc VIP
- 【倍福BECKHOFF】TwinCAT3-Licensing_zh_CN 中文手册.pdf VIP
- 镇海小港李氏家谱.pdf VIP
- 2024年高考生物必背长句子作答整理(答案版).docx VIP
原创力文档

文档评论(0)