- 51
- 0
- 约1.03万字
- 约 91页
- 2017-08-31 发布于广东
- 举报
(C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 (C) Vipin Kumar, Parallel Issues in Data Mining, VECPAR 2002 数据挖掘 分类:基本概念、决策树与模型评价 分类的是利用一个分类函数(分类模型、分类器),该模型能把数据库中的数据影射到给定类别中的一个。 分类 训练集:数据库中为建立模型而被分析的数据元组形成训练集。 训练集中的单个元组称为训练样本,每个训练样本有一个类别标记。 一个具体样本的形式可为:( v1, v2, ..., vn; c );其中vi表示属性值,c表示类别。 测试集:用于评估分类模型的准确率 数据分类——一个两步过程 (1) 第一步,建立一个模型,描述预定数据类集和概念集 假定每个元组属于一个预定义的类,由一个类标号属性确定 学习模型可以用分类规则、决策树或数学公式的形式提供 数据分类——一个两步过程 (2) 第二步,使用模型,对将来的或未知的对象进行分类 首先评估模型的预测准确率 对每个测试样本,将已知的类标号和该样本的学习模型类预测比较 模型在给定测试集上的准确率是正确被模型分类的测试样本的百分比 测试集要独立于训练样本集,否则会出现“过分适应数据”的情况 如果准确性能被接受,则分类
您可能关注的文档
- 助理人力师《方案设计》练习补充题目1.doc
- 助理营销师总复习2011.ppt
- 助理营销师理论复习资料.doc
- 网络营销学2 销售促进策划.doc
- 医疗机构药品集中采购工作规范与药品集中采购监督管理办法宣贯实施手册.pdf
- 网络营销策划-服装.ppt
- 网络营销策划:一阴一阳之谓道.pdf
- 印刷ERP迅速成为印刷企业信息化的新宠.pdf
- 舒珍--论文7.doc
- 舒立平 店长培训11.ppt
- 2026年智慧健康管理系统创新报告.docx
- 河北衡水市武强中学2025-2026学年高二下学期4月期中物理试题(含解析).docx
- 2026年人工智能行业智能老年防走失定位器创新报告.docx
- 2026年低空经济飞行器量子技术应用创新报告.docx
- 2026年农业智能农业智能育种创新报告.docx
- 河北省保定市莲池区保定市第一中学2025-2026学年高二下学期期中考试生物试题(含解析).docx
- 2026年智慧城市电子站牌充电创新报告.docx
- 河北省邯郸市平恩中学等校2025-2026学年八年级期中考试英语试题(含解析).docx
- 2026年供应链创新技术应用报告.docx
- 2026年体育智能赛事管理系统支付系统创新报告.docx
最近下载
- Unit 4 Eat Well 单元测试题 新教材 人教版七年级英语下册.doc VIP
- 政策汇编-全国碳市场交易制度法规政策汇编-2024.pdf VIP
- 太原市2026届高三(二模)语文试卷(含答案及解析).pdf
- 江宁校区新建危废库项目环境影响报告.pdf VIP
- 重症急性胰腺炎.pptx VIP
- 物理学基础与学科发展前沿专题一 绪论.ppt VIP
- 2024年韶关市新丰县医共体招聘专业技术人员笔试真题.docx VIP
- 新版标志牌GB 2894-2025《安全色和安全标志》word版.docx VIP
- 2025年韶关市新丰县医共体招聘专业技术人员笔试真题.docx VIP
- 2025年毕业论文开题报告撰写方法(十五篇).docx VIP
原创力文档

文档评论(0)