- 9
- 0
- 约1.03万字
- 约 92页
- 2016-11-21 发布于河北
- 举报
第4章分类_基本概念_决策树与模型评估.ppt
(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 数据挖掘 分类:基本概念、决策树与模型评价 分类的是利用一个分类函数(分类模型、分类器),该模型能把数据库中的数据影射到给定类别中的一个。 分类 训练集:数据库中为建立模型而被分析的数据元组形成训练集。 训练集中的单个元组称为训练样本,每个训练样本有一个类别标记。 一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示属性值,c表示类别。 测试集:用于评估分类模型的准确率 数据分类——一个两步过程 (1) 第一步,建立一个模型,描述预定数据类集和概念集 假定每个元组属于一个预定义的类,由一个类标号属性确定 学习模型可以用分类规则、决策树或数学公式的形式提供 数据分类——一个两步过程 (2) 第二步,使用模型,对将来的或未知的对象进行分类 首先评估模型的预测准确率 对每个测试样本,将已知的类标号和该样本的学习模型类预测比较 模型在给定测试集上的准确率是正确被模型分类的测试样本的百分比 测试集要独立于训练样本集,否则会出现“过分适应数据”的情况 如果准确性能被接受,则分类
您可能关注的文档
- 瑞阳电子公司年度招聘计划书.doc
- 生产与质量管理11供应链管理.ppt
- 生产决策——亏损增产1.ppt
- 生命周期与组织.ppt
- 生産與_作戰略决策.ppt
- 用例实现规约-年度计划实绩管理.doc
- 电动汽车品牌管理意见书.ppt
- 电子商务之供应商管理(英文).ppt
- 目标决策.doc
- 直觉、归因、决策.ppt
- (共19页PPT)湘艺音乐六下《7优质课.ppt
- (共20页PPT)趣味乐理节奏密码•均拍课件.pptx
- (共23页PPT)课时8296物理选择性必修三45粒子的波动性和量子力学的建立45粒子的波动性和量子力学的建立.pptx
- (共24页PPT)六年级2课件.ppt
- (共26页PPT)我一生中的重要抉择课件.pptx
- (共28页PPT)课时39必修2第6章第2节自然选择与适应的形成课件.ppt
- (共29页PPT)课时34第五单元自制礼物赠亲友第3课时礼品包装讲方法课件.ppt
- (共30页PPT)专项二模型建构能力.pptx
- (共31页PPT)鍘嗗彶蹇呬慨涓鍘嗗彶绾茶锛堜笂锛夋暀瀛﹁浠閰嶅鏂版暀鏉楂樹腑鍘嗗彶蹇呬慨涓鍘嗗彶绾茶锛堜笂锛绗節鍗曞厓绗7璇绀句細涓讳箟寤鸿鍦ㄦ帰绱腑鏇叉姌鍙戝睍.pptx
- (共33页PPT)课时22261届术科生英语课话题4文娱与体育题型专练届术科生英语课话题4文娱与体育题型专练.pptx
最近下载
- 地下管线普查方案.doc VIP
- 2026年外包公司软件测试工程师面试全解析.docx VIP
- 2024版光伏工程施工工艺手册.pdf VIP
- 母婴保健技术服务许可证校验申请书.doc VIP
- 集团公司供应商管理办法.docx VIP
- 压力式膜技术手册(Memcor).pdf VIP
- 初中英语1600词新课标词汇(按话题分类).docx VIP
- DL∕T电力企业标准化工作指南(2024).pdf VIP
- 2024年供水公司安全生产“一岗双责”实施方案(三篇) .pdf VIP
- Unit1 Art Reading for writing【知识精研】英语人教版(2019) 选择性必修三同步课.pptx VIP
原创力文档

文档评论(0)