基于clementine的数据挖掘算法决策树概论
基于clementine的数据挖掘算法章节安排数据挖掘概述决策树C5.0算法算法231目录数据挖掘方法论步骤1确定培训需求步骤2确定培训目标步骤3设计培训方案步骤4步骤5落实培训成果步骤5落实培训成果业务理解数据理解数据准备建立模型模型评价模型应用商业目的模型输出模型定义列出指标评估数据质量数据清洗指标筛选选择算法建立模型模型评估是否符合商业目的将数据挖掘结果形成报告CRISP-DM数据挖掘实施方法论帮助企业把注意力集中在解决业务问题上,它包括了六个步骤,涵盖了数据挖掘的整个过程。本次培训内容数据准备—重要性分析变量重要性分析,是去除变量冗余,是对变量的浓缩和提炼,保留对输出变量的预测有重要贡献的变量和样本,剔除不重要的变量和样本。变量与输出变量、变量间的相关程度从变量自身考察变量重要性分析方法变量值中缺失值所占比例分类变量中,类别个数占样本比例数值变量的变异系数数值型变量的标准差输入、输出变量均为数值型:做两个变量的相关性分析输入变量为数值型、输出变量为分类型:方差分析(输出变量为控制变量、输入变量为观测变量)输入变量为分类型、输出为数值型:方差分析(输入变量为控制变量、输出变量为观测变量)输入、输出变量均为分类型:卡方检验方差分析(AnalysisofVariance)是利用样本数据检验两个或两个以上的总体均值间是否有差异的一种方法。在研究一个变量时,它能够解决多个总体的均值是
您可能关注的文档
- 地面高速移动通信解决方案简述任翔概论.ppt
- 城市生态环境:最新7概论.ppt
- 城市系统学:案例研究方法概论.pptx
- 城市热网集中监控平台和在线监测解决方案概论.ppt
- 城市规划展示馆概论.ppt
- 城市轨道交通控制专业剖析概论.ppt
- 城市综合应急管理系统通用解决方案概论.ppt
- 城市规划的典范:巴西利亚概论.ppt
- 城市道路与交通城市道路网规划概论.ppt
- 城市商业综合体酒店和主力店招商谈判技巧与流程概论.ppt
- 新疆塔城地区第一高级中学2025-2026学年高一下学期学情自测物理试卷(含解析).docx
- 苏教版五年级上册数学 期中检测卷.doc
- 新疆维吾尔自治区昌吉回族自治州呼图壁县2025-2026学年九年级上学期1月期末英语试题(含解析).docx
- 新疆维吾尔自治区和田地区和田市2025-2026学年上学期八年级英语期末试卷(含解析).docx
- 四川省绵阳市游仙区2025-2026学年七年级上学期1月期末英语试题(含解析).docx
- 苏教版三年级上册数学 第三单元测试题.doc
- 四川省绵阳市梓潼县2025-2026学年八年级上学期1月期末物理试题(含解析).docx
- 四川省绵阳市盐亭县四校联考2025-2026学年八年级下学期物理学情自测(含解析).docx
- 房颤患者太极拳练习.pptx
- 苏教版五年级上册数学 期末检测卷.doc
最近下载
- 2024最新教育系统校级年轻后备干部考试应知应会题库及答案.docx VIP
- 高频精选:高校档案馆面试题及答案.doc VIP
- 作业治疗复习测试卷附答案.doc VIP
- 孤独症治疗评估量表(ATEC).docx VIP
- 人工挖孔桩一套检验批.docx VIP
- 2025年山东省员额法官遴选面试考题及答案.docx
- 2026高考化学复习 化学方程式汇总(默写版+背诵版).pdf
- 挖孔桩检验批.docx VIP
- 03J203 平屋面改坡屋面建筑构造.pdf
- 中国国家标准 GB/T 44585.1-2024风险管理在接入IT网络的医疗器械中的应用 第1部分:联网医疗器械或健康软件在其实施和使用中的安全、有效性和网络安全.pdf
原创力文档

文档评论(0)