- 96
- 0
- 约4.84千字
- 约 36页
- 2017-05-23 发布于广东
- 举报
数据预处理与清理数据
* 离散化:聚类分析方法 将数据按照“类内最大相似度,类间最小相似度的原则”对数据进行有效聚类 利用聚类的中心点来表示该类所包含的对象 数据聚类将非常有效,但是必须保证数据中没有噪音数据 * * 本节结论 数据的预处理无论对于数据仓库和数据挖掘都是非常重要的一个环节 数据预处理包括 数据清理 数据集成 数据归约和特征选取 数据的离散化 数据预处理涉及面广,现已建立了一系列的方法,但是目前仍然是一个非常活跃的研究领域 * * 简介:可视化数据挖掘 可视化: 使用计算机图形学创建可视化图像,帮助用户理解复杂,大规模数据 可视化数据挖掘: 使用可视化技术,从大规模数据集中发现隐含,有用知识的过程 可视化的目的 提供对大规模数据集定性的理解 查看数据中的模式,趋势,结构,不规则性,关系等 帮助寻找感兴趣的区域,为进一步定量分析提供合适的参数 为计算机得出的结果提供可视化的证明 * * 可视化与数据挖掘的结合 数据可视化 数据挖掘结果可视化 数据挖掘过程可视化 交互式可视化数据挖掘 * * 数据挖掘过程可视化 将数据挖掘各种处理过程用可视化的方式呈现给用户,可以看到: 数据是如何被提取的 是从哪个数据库或数据仓库提取的数据 被选择数据如何被清理,整合,处理和挖掘的 在数据挖掘中采用什么方法 数据被存储在哪里 * * 交互式可视化数据挖掘 使用可视化工具在数据挖掘过程中帮助用户作出更加合理的
您可能关注的文档
- 山东省20072013高考试题.doc
- 山西省吕梁学院附中2015届高三上学期第三次月考生物试卷.doc
- 川北医学院医学免疫学教案五年制本科.doc
- 川大体育理论测试答案史上最完整版.doc
- 工业发酵的被动性和人的主观能动作用无锡,200211.ppt
- 岛屿物种的形成和岛屿的群落结构.ppt
- 巴纳德的系统行政组织学说.ppt
- 工具酶的发现和基因工程的诞生、基因工程的原理和技术.ppt
- 局部晚期非小细胞肺癌精准放疗的进展与挑战——2016BestofWCLC.ppt
- 广东省中山市2015-2016学年度八年级生物下册733生物进化的原因课件新人教版.ppt
- 2026《岳阳林纸中高层领导力现状、问题及对策》9200字.doc
- 2026《云南白药内部控制中存在的问题及对策研究》6500字 .doc
- 2026《云南水富云天化企业所得税会计研究》8800字 .doc
- 2026《长赐轮事件中的各类损失及海上保险问题分析》4200字.docx
- 2026《直播带货发展背景下企业品牌价值评估研究的相关理论文献研究综述》6100字.docx
- 6 怎么都快乐 课件-2025-2026学年语文一年级下册统编版.pptx
- 2026《旬邑彩贴剪纸保护与传承研究的文献综述》3300字.docx
- 2026《伊春光明集团薪酬管理改进调研报告》6000字.doc
- 《变现金句1000条》番外篇.pdf
- 第8课《时间的脚印》课件(内嵌视频)-2025-2026学年统编版语文八年级下册.pptx
原创力文档

文档评论(0)