- 1、本文档共54页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘第8章--分类:基本概念要点
数据挖掘与商务智能;第八章 分类;基本概念;分类 VS. 预测;一个两步过程 ;6;7;有指导的学习 VS. 无指导的学习;决策树归纳;用决策树归纳分类;用决策树归纳分类;决策树归纳策略;属性选择度量;信息增益;例8.1;16;计算连续值属性的信息增益;增益率;基尼指数;属性选择度量对比;过度拟合与树剪枝;可伸缩性与决策树归纳;23;贝叶斯分类方法;贝叶斯定理;朴素贝叶斯分类(Na?ve Bayesian);使用朴素贝叶斯分类预测类标号;使用朴素贝叶斯分类预测类标号;使用朴素贝叶斯分类预测类标号;使用拉普拉斯校准避免计算零概率值 ;基于规则的分类;使用IF-THEN规则分类;使用IF-THEN规则分类;由决策树提取规则;模型评估与选择;模型评估与选择;评估分类器性能的度量;评估分类器性能的度量:混淆矩阵;准确性、错误率、敏感度和特效性;精度、召回率、 F 度量 ;例子;保持方法, 随机二次抽样;自助法;使用统计显??性检验选择模型;使用统计显著性检验选择模型;t-检验;使用统计显著性检验选择模型;提高分类准确率的技术;提高分类准确率的技术;装袋:自助聚集;提升;Adaboost;提高类不平衡数据的分类准确率;谢
文档评论(0)