- 21
- 0
- 约8.54千字
- 约 14页
- 2016-04-17 发布于贵州
- 举报
第一章
数据挖掘的概念及其特点
数据挖掘
概念:在大量的数据中挖掘感兴趣的知识(规则,规律,模式,约束)
数据挖掘 (从数据中发现知识)
特点:从大量的数据中挖掘哪些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识
挖掘的不仅仅是数据(所以“数据挖掘”并非一个精确的用词)
数据挖掘的核心(KDD)是什么?
知识挖掘(KDD) 数据挖掘与知识发现
从KDD对数据挖掘的定义中可以看到当前研究领域对数据挖掘的狭义和广义认识
数据清理: (这个可能要占全过程60%的工作量)
数据集成
数据选择
数据变换
数据挖掘(选择适当的算法来找到感兴趣的模式)
模式评估
知识表示
数据挖掘的体制结构。
数据挖掘的主要方法(能够区分)常用模式
分类预测的说明:比如:按气候将国家分类,按汽油消耗定额将汽车分类
导出模型的表示: 判定树、分类规则、神经网络
可以用来预报某些未知的或丢失的数字值
聚类分析的说明:例:对WEB日志的数据进行聚类,以发现相同的用户访问模式
孤立点分析的说明
(应用)信用卡欺诈检测/移动电话欺诈检测/客户划分/医疗分析(异常)
第二章
数据仓库的概念(特点就在概念里)
数据仓库是一个(1)面向主题的、(2)集成的、(3)随时间而变化的、(4)不容易丢失的数据集合,支持管理部门的决策过程.
OLAP(联机分析处理)和OLTP(联机事务处理)的区别
1、
您可能关注的文档
- 燃料电池综合特研究.doc
- 燃料智能化管理统——燃料过程管理与效能监督系统(发电企业必备).doc
- 燃煤电厂环保新题蓝烟黄烟现象的研究及其对策.doc
- 燃煤电厂脱硫脱项目职业病危害因素辨识及噪声控制设计.doc
- 燃煤锅炉房烟气硫除尘.doc
- 让数学课堂鲜活纲.doc
- 让微型德育回归活.doc
- 人才工作机制改与政策创新二83分.doc
- 人才培养模式及学模式.doc
- 人才需求与专业革调研报告.doc
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
最近下载
- 应聘高校科研人员的工作计划.docx
- 上海新高考数学解析几何 第 20 题试题+解答汇总.docx VIP
- 在线网课学习课堂《雷达原理与系统(中国人民解放军战略支援部队信息工程)》单元测试考核答案.docx VIP
- DLT5210.1-2021电力建设施工质量验收规程(全word表格版)..doc
- 南京信息工程大学2021-2022学年第2学期《线性代数》期末试卷(B卷)及参考答案.docx
- 20251217-中国基金投顾业务洞察报告(2025).pdf VIP
- 卷一 2018年6月英语六级真题及答案.pdf VIP
- HDB3编解码报告_原创精品文档.pdf VIP
- 高考英语完形填空专题集中训练含答案(精选5份).docx VIP
- 南京信息工程大学2022-2023学年第2学期《线性代数》期末试卷(A卷)及参考答案.docx
原创力文档

文档评论(0)