- 3
- 0
- 约6.72千字
- 约 59页
- 2016-12-31 发布于贵州
- 举报
准备分类和预测的数据 通过对数据进行预处理,可以提高分类和预测过程的准确性、有效性和可伸缩性 数据清理 消除或减少噪声,处理空缺值,从而减少学习时的混乱 相关性分析 数据中的有些属性可能与当前任务不相关;也有些属性可能是冗余的;删除这些属性可以加快学习步骤,使学习结果更精确 数据变换 可以将数据概化到较高层概念,或将数据进行规范化 比较分类方法 使用下列标准比较分类和预测方法 预测的准确率:模型正确预测新数据的类编号的能力 速度:产生和使用模型的计算花销 鲁棒性:给定噪声数据或有空缺值的数据,模型正确预测的能力 可伸缩性:对大量数据,有效的构建模型的能力 可解释性:学习模型提供的理解和洞察的层次 用判定树归纳分类 什么是判定树? 类似于流程图的树结构 每个内部节点表示在一个属性上的测试 每个分枝代表一个测试输出 每个树叶节点代表类或类分布 判定树的生成由两个阶段组成 判定树构建 开始时,所有的训练样本都在根节点 递归的通过选定的属性,来划分样本 (必须是离散值) 树剪枝 许多分枝反映的是训练数据中的噪声和孤立点,树剪枝试图检测和剪去这种分枝 判定树的使用:对未知样本进行分类 通过将样本的属性值与判定树相比较 判定归纳树算法 判定归纳树算法(一个贪心算法) 自顶向下的分治方式构造判定树 树以代表训练样本的单个根节点开始 使用分类属性(如果是量化属性,则需先进行离散化) 递归的通过选择
您可能关注的文档
- 树枝粉碎成型机设计.doc
- 竖在字中的变化_刘欣.doc
- 数电课件 第二章 逻辑代数基础2.ppt
- 数据备份与复制.doc
- 数据采集平台数据分析策略福建农业职业技术学院网络信息中心.ppt
- 数据仓库技术知识.docx
- 数据仓库与数据挖掘技术 第6章 数据预处理技术.ppt
- 数据结构发展史.doc
- 数据结构第3章 栈和队列.ppt
- 数据结构实验答案.doc
- 司空曙送别诗分析.pdf
- 八年级数学下学期期中学情自测-拔尖卷(新教材北师大版,第1章-第4章).pdf
- 双碳目标下宁夏植被覆盖时空变化的驱动因素及发展策略研究.pdf
- 双网络水凝胶的制备及其在柔性传感器的应用研究.pdf
- 2025-2026学年一年级数学下学期6月学情自测-提升卷02(1-7单元)(苏教版-新教材).pdf
- 2025-2026学年湖南永州市冷水滩区牛角坝镇中心小小学人教版六年级数学下学期学情检测试卷.pdf
- 2025-2026学年湖北省孝感市云梦县人教版三年级下学期期末学情调研数学试卷.pdf
- 2025-2026学年湖南永州市冷水滩区花桥镇中心小学等校人教版五年级数学下学期1-3单元学情自测.pdf
- 2025-2026学年重庆永川区人教版下学期期末质量监测题六年级数学试卷.pdf
- 火力发电工程质量监督检查记录.pdf
最近下载
- 高中英语_Unit 4 After Twenty Years教学设计学情分析教材分析课后反思179.pdf VIP
- SJG 05-2020 基坑支护技术标准.docx VIP
- (完整word版)走遍美国-中英对照文本(绝对全面).pdf VIP
- 药品经营和使用质量监督管理办法培训.pptx VIP
- 汉钟配套用冷凝器参数.docx VIP
- 中国急性缺血性卒中诊治指南(2026版).docx VIP
- 医疗卫生事业单位招聘通用能力测试(卫生类)考试内容及历年真题题库大全.docx VIP
- 金融稳定理事会稳健薪酬实践原则及实施标准 薪酬风险及绩效匹配方法论 第三支柱下对银行薪酬的披露要求.pdf VIP
- 2026年江苏苏锡常镇四市高三二模高考生物试卷(含答案详解).docx VIP
- Zynq UltraScale+ SoC配置文件加载重构方法.pdf VIP
原创力文档

文档评论(0)