- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 数据挖掘基本算法
本章内容:
6.1 分类规则挖掘
6.2 预测分析与趋势分析规则
6.3 数据挖掘的关联算法
6.4 数据挖掘的聚类算法
6.5 数据挖掘的统计分析算法
6.6 数据挖掘的品种优化算法
6.7 数据挖掘的进化算法
6.1 分类规则挖掘
6.1.1分类与估值
1 分类
为了理解事物特征并做出预测使用历史数据建立
一个分类模型(即分类器)的过程 。
应用于信用卡系统中的信用分级、市场调查、疗
效诊断、寻找店址等
实践应用参照课本
6.1 分类规则挖掘
6.1.1分类与估值
2 估值
估值(estimation )与分类类似,不同之处在于,分类
描述的是离散型变量的输出,而估值处理连续值的输
出;分类的类别是确定的数目,估值的量是不确定的。
3 分类方法与步骤
方法:决策树归纳、贝叶斯分类、贝叶斯网络、神经网络。还有K-最临
近分类、基于案例的推理、遗传算法、粗糙集和模糊集方法 。
步骤:模型创建、模型使用
6.1 分类规则挖掘
6.1.1分类与估值
4 评估分类方法
要考虑的指标:预测准确率、速度、创建速
度、使用速度、鲁棒性、处理噪声和丢失值、
伸缩性、对磁盘驻留数据的处理能力、可解释
性、对模型的可理解程度、规则好坏的评价、
决策树的大小和分类规则的简明性。
6.1 分类规则挖掘
6.1.2 决策树
子节点
父节点 子节点
叶节点
根节点 子节点
叶节点
父节点 子节点
子节点
图6.1 一般决策树结构
mmmm
iiii
pppp loglogloglog 2222 ((((pipipipi ))))
iiii 1111
6.1 分类规则挖掘
6.1.2 决策树
•1.决策树的构造过程
ID3算法应用如下:
m (6.1 )
i
信息量计算公式:I(s1,s2,…sm)=- p log 2 (pi )
其中,pi为si
文档评论(0)