- 7
- 0
- 约2.97千字
- 约 32页
- 2017-08-29 发布于江苏
- 举报
数据仓库与数据挖掘 第7章 数据分类 7.1 引例 分类的定义 分类是指把数据样本映射到一个事先定义的类中的学习过程,即给定一组输入的属性向量及其对应的类,用基于归纳的学习算法得出分类。 7.1 引例 7.1 引例 分类问题使用的数据集格式 描述属性可以是连续型属性,也可以是离散型属性;而类别属性必须是离散型属性。 连续型属性是指在某一个区间或者无穷区间内该属性的取值是连续的 ,例如属性“Age” 离散型属性是指该属性的取值是不连续的 ,例如属性“Salary”和“Class” 7.1 引例 分类问题使用的数据集格式 分类问题中使用的数据集可以表示为X={(xi,yi)|i=1,2,…,total} xi=(xi1,xi2,…,xid) ,其中xi1,xi2,…,xid分别对应d个描述属性A1,A2,…,Ad的具体取值 yi表示数据样本xi的类标号,假设给定数据集包含m个类别,则yi∈{c1,c2,…,cm},其中c1,c2,…,cm是类别属性C的具体取值 未知类标号的数据样本x用d维特征向量x=(x1,x2,…,xd)来表示 7.2 分类问题概述 7.2.1 分类的过程 7.2.2 分类的评价准则 7.2.1 分类的过程 7.2.1 分类的过程 获取数据 输入数据、对数据进行量化 预处理 去除噪声数据、对空缺值进行处理 数据集成或者变换 分类器设计 划分数据集、分类
您可能关注的文档
- 商务礼仪培训课件29633.ppt
- 上)中国道路与全球价值:刑事诉讼制度三十年(.doc
- 上海市 松江区社区卫生服务中心绩效考核探索.ppt
- 设计色彩学习研究:绿色.doc
- 设计史 第五章 走向多元化的设计.ppt
- 设计原理--环境伦理.ppt
- 社会学 第三章 文化.ppt
- 社会学 第十五章 信息、网络与社会26插图版.ppt
- 社会学概论新修+社会调查方法.docx
- 社会学概论-绪论.ppt
- 2026—2028年中国影视经纪代理服务行业生态全景与战略纵深研究报告:政策、技术、资本与消费四重驱动下的产业重构与机遇地图.pptx
- 综合医院迁建项目社会稳定性影响评估报告.docx
- 合规转利润:降本增效全指南(2026)《YZT 0165-2018〈寄递服务人员基础数据元〉》.pptx
- 《三国鼎立》历史教学课件.pptx
- FMEA潜在失效模式试卷及答案.docx
- 2026年动机测试题及答案.doc
- 2025年交通运输行业驾驶员部驾驶员行车安全手册.docx
- AI化学实验安全事件关联性分析课题报告教学研究课题报告.docx
- 2025年汽车行业质检部质检员质量追溯体系手册.docx
- 高中地理教学中学生空间思维能力的培养与提升策略教学研究课题报告.docx
原创力文档

文档评论(0)