- 3
- 0
- 约5.52千字
- 约 47页
- 2018-08-11 发布于江苏
- 举报
数据挖掘与知识发现(复杂数据对象的数据挖掘与知识发现) 数据挖掘的困难所在 Noise Skewed distribution Missing values (incomplete info) Scalability High dimensionality Bias in data ... 预处理在知识发现中所占份量 预处理 各种不同的数据源和数据对象 数据的选择、集成与整合,对问题进行限定 数据库中的数据具有噪声、缺值、不易至 数据的去噪和规范化问题,提高挖掘精度 数据的变换 规范化、映射到不同的空间,提高挖掘效率 数据的规约 取出冗余、属性聚类来压缩数据 数据的预处理是KDDDM的重要步骤 预处理的基本功能 预处理主要是接受并理解KDD要求,确定发现任务 抽取与发现任务相关的数据源,根据背景知识中的约束性规则对数据进行合法性检查 通过清理和归约等操作,生成供挖掘核心使用的目标数据。 它汇集了原始数据库中与发现有关的所有数据的总体特征,是知识发现状态空间的基底。 4 数据挖掘的预处理 4.1数据选择与集成 4.2数据清理 4.4数据归约 4.4数据变换 4.5数据离散 4.1 数据选择 分析需求和应用,了解业务背景 确定分析主题 数据库或数据仓库中选择索要分析的数据 利用数据转换工具进行分析处理 4.1 数据集成
您可能关注的文档
- 软件开发案例分析(二)计算机网络商城.ppt
- 碰撞与冲击动力学.3.2.ppt
- 中国科技大学C语言讲义2.ppt
- 连云港财务.比率分析.ppt
- 中山本科大学化工原理课件第1讲和第2讲练习课.ppt
- sws工程勘探与工程检测系统手册方法.ppt
- 本科大学物理第5讲习题课.ppt
- 局域网打印机机共享设置教程.ppt
- 眼和视觉形成.ppt
- 20092010(09级)四川省四川大学线性代数期末考试卷.ppt
- 第一节 电阻和变阻器(讲义)物理沪科版2024九年级全一册.docx
- 第3节 质量的测量 (讲义) 物理沪科版(五四学制)2024 八年级上册.docx
- 第14讲 圆周运动(复习讲义)高考物理一轮复习.docx
- 暑假预习专题15 指数函数(20题型)新高一数学讲义(沪教版2020).docx
- 第二节 发电机是怎样工作的(讲义)物理沪科版2024九年级全一册.docx
- 4.18 东晋南朝政治和江南地区开发 教学设计 部编版七年级上学期历史.docx
- 2.5实验:用单摆测量重力加速度(表格式教学设计)物理人教版2019选择性必修第一册.docx
- 第49讲 沉淀溶解平衡及图像分析(讲义)高考化学复习讲义(新教材新高考).docx
- 旅游景区行业分析报告:内外兼修,多元创新.pdf
- Unit 1~2 单元语法知识点梳理 高二下学期期中考点(上教版2020选择性必修第二册).pptx
最近下载
- 2023注册消防工程师(消防安全技术实务)题库带答案(轻巧夺冠).docx
- 机务培训课件 B737NG-B级(ME)-ATA75空气系统(1601).pptx VIP
- 国际海事组织PPT课件.pptx VIP
- 《实验室安全培训》课件.ppt VIP
- 数字化转型下山东机场人力资源管理系统的设计与实践:基于战略协同与效能提升.docx VIP
- 广东惠州辅警面试题目及答案.doc VIP
- 2025年台州市一模语文试卷初三中考 .pdf VIP
- 2025年下半年四川甘孜州考试招聘事业单位人员138人参考题库附答案.docx VIP
- 2023年心理咨询师完整题库【word】.docx
- 一种多功能组合的角膜刀.pdf VIP
原创力文档

文档评论(0)