- 7
- 0
- 约1.36万字
- 约 5页
- 2016-10-01 发布于贵州
- 举报
数据挖掘课程内整理
数据挖掘:(定义)从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘。(功能)概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等。(典型数据挖掘系统组成)数据库,数据仓库或其他信息库;数据库或数据仓库服务器;知识库;数据挖掘引擎;图形用户界面。(步骤)(1)数据清理:消除重复的、不完全的、违反语义约束的数据(2)数据集成:多种数据源可以组合在一起(3)数据选择:从数据库中检索与分析任务相关的数据(4)数据变换:数据变换或统一成适合挖掘的形式,如通过汇总或聚集操作(5)数据挖掘:使用智能方法提取数据模式(6)模式评估:根据某种兴趣度度量,识别表示知识的真正有趣的模式(7)知识表示:使用可视化和知识表示技术,向用户提供挖掘的知识(前4个是数据预处理步骤)
据预处理:(原因)原始业务数据来自多个数据库或数据仓库,它们的结构和规则可能是不同的,这将导致原始数据非常的杂乱、不可用,即使在同一个数据库中,也可能存在重复的和不完整的数据信息,为了使这些数据能够符合数据挖掘的要求,提高效率和得到清晰的结果,必须进行数据的预处理。(内容)a数据清洗:包括填充空缺值,识别孤立点,去掉噪声和无关数据。b数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问
您可能关注的文档
- 教师如何维护心健康.docx
- 教师岗前培训何20150824.doc
- 教师心理素质测 试题汇总.doc
- 教师文明礼仪规公约.doc
- 教师应具备的专素质.doc
- 教师的个人素质学生成长的影响.doc
- 教师幸福感的调报告.docx
- 教师职业道德课标准学科专业素养试题库 省研修小学部分.doc
- 教师证教育心理考试复习提纲.doc
- 教改项目申请书王玫黎.doc
- 控笔线条训练字帖.docx
- 2026年英大传媒投资集团有限公司校园招聘考试参考试题及答案解析.docx
- 2026年中国盐业集团有限公司校园招聘考试参考试题及答案解析.docx
- 2026年鞍山市立山区事业单位招聘笔试备考题库及答案解析.docx
- 2026年贵阳市工商资产经营管理有限公司校园招聘考试参考试题及答案解析.docx
- 2026年中国烟草总公司青海省公司校园招聘考试参考试题及答案解析.docx
- 2026及未来5年塔机变频柜项目可行性研究报告(市场调查与数据分析).docx
- 2026年吴忠市红寺堡区事业单位招聘笔试备考题库及答案解析.docx
- 2026年北京公共交通控股集团有限公司校园招聘考试参考题库及答案解析.docx
- 2026年亳州市谯城区事业单位招聘笔试备考试题及答案解析.docx
最近下载
- LS-1866常用参数设置方法.pdf VIP
- 〖历史〗改革开放的起步教学课件 2025-2026学年统编版八年级历史下册.pptx VIP
- 台球项目计划书.docx VIP
- 支部班子“加强理论武装、执行上级组织决定、加强党员管理监督等六个对照”2025年度组织生活会班子对照检查提纲四篇.docx VIP
- 胸部影像学检查临床应用指南(2025年版).docx
- 八达KBZ20-630(1000)-1140矿用隔爆真空馈电开关说明书-中文.doc VIP
- 第二单元主题活动二《爱心捐物箱》(教学设计)-2023-2024学年五年级下册综合实践活动内蒙古版.docx VIP
- 乙酰水杨酸工业制备工艺详解.docx VIP
- 责任护士不掌握患者主要护理问题及措施原因及整改措施.docx VIP
- 新型杀虫剂与三种重金属对白符跳虫的毒性效应及机制探究.docx VIP
原创力文档

文档评论(0)