- 12
- 0
- 约1.04万字
- 约 13页
- 2024-06-01 发布于北京
- 举报
数据挖掘概述
数据挖掘
定义:通过自动或半自动化的工具对大量的数据进行探索和分析的过程,其目的是发现其中有意义的模式和规律。
——数据挖掘是一门技能,不是一种现成的产品。
数据挖掘能做什么
6种方法:分类(classification)、估计(estimation)、预测(prediction)、组合或关联法则(affinitygroupingorassociationrules)、聚类(clustering)、描述与可视化(descriptionandvisualization)
前三种方法属于直接的数据挖掘,目标是应用可得到的数据建立模型,用其他可得到的数据来描述我们感兴趣某一变量。
后三种方法属于间接的数据挖掘,没有单一的目标变量,目标是在所有变量中发现某些联系。
分类:其特点是先对不同的类别加以定义,并由预先分类的样本构成训练集。任务是建立一个模型并应用这一模型对未分类数据进行分类。分类处理的是离散的结果。
估计处理的是连续的结果。
组合法的任务是确认哪些事物会一起出现。
聚类的任务是将相似的事物分成一类,差异较大的事物分在不同的类中。聚类与分类的区别是聚类并不依赖于事先确定好的组别。
技术层面的数据挖掘
算法与技巧
数据
建模实践
二、数据挖掘方法论:互动循环系统
数据挖掘的两种类型
一种是自上而下的方法,称之为有监督的数据挖掘方法,当明确知道要搜索的目标时,
您可能关注的文档
- 紫外吸收光度法测量十二烷基硫酸钠的CMC.doc
- 智慧畜牧发展存在的问题及对策建议.doc
- 外科学-第八章-重症监测治疗与复苏.ppt
- 2023年“我最喜欢的一本书”读书演讲比赛主持稿.docx
- 旅游管理专业建设方案.docx
- 统编版高中政治必修三同步练习题-第二单元-人民当家作主-单元测试(含答案)01.docx
- 泵站运营方案.docx
- 精密加工控制与检测教案.doc
- 人教版四年级下册数学第七、八、九单元测试题及答案.docx
- 新课标-高一物理-功-功率练习题(原创带答案).doc
- 《GB 47367-2026轧制设备安全技术条件》.pdf
- 中国国家标准 GB 47367-2026轧制设备安全技术条件.pdf
- GB/T 32852.2-2026城市客运术语 第2部分:公共汽电车.pdf
- 《GB/T 32852.2-2026城市客运术语 第2部分:公共汽电车》.pdf
- 中国国家标准 GB/T 32852.2-2026城市客运术语 第2部分:公共汽电车.pdf
- 《GB/T 31723.406-2026金属电缆和其他无源元件试验方法 第4-6部分:电磁兼容 表面转移阻抗 线注入法》.pdf
- GB/T 31723.406-2026金属电缆和其他无源元件试验方法 第4-6部分:电磁兼容 表面转移阻抗 线注入法.pdf
- 中国国家标准 GB/T 31723.406-2026金属电缆和其他无源元件试验方法 第4-6部分:电磁兼容 表面转移阻抗 线注入法.pdf
- GB/T 47402-2026制冷系统和热泵 人员能力.pdf
- 中国国家标准 GB/T 47402-2026制冷系统和热泵 人员能力.pdf
最近下载
- 全国一级建造师执业资格考试《建设工程法规及相关知识》2015-2020 历年考试真题与解析.docx VIP
- (二模)黄冈市2026年3月高三年级模拟考试英语试卷(含答案解析)+听力音频+听力原文.docx
- 年产10000吨乌龙茶饮料工厂设计.docx VIP
- 子宫内膜癌护理.pptx VIP
- 台达A3伺服电机凸轮追剪飞剪应用指南.pptx VIP
- 【一建经济】11-XW-历年真题解析(2015-2020).pdf VIP
- 2025年中国金属废料数据监测研究报告.docx
- 遵义正安县辅警招聘考试真题2023.pdf VIP
- 老年人的离婚协议书范文(标准版).docx VIP
- 通信设备成品保护措施及风险管理.docx VIP
原创力文档

文档评论(0)