《数据仓库与数据挖掘技术》第6章:数据挖掘基本算法.pdf

《数据仓库与数据挖掘技术》第6章:数据挖掘基本算法.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6章 数据挖掘基本算法 本章内容:  6.1 分类规则挖掘  6.2 预测分析与趋势分析规则  6.3 数据挖掘的关联算法  6.4 数据挖掘的聚类算法  6.5 数据挖掘的统计分析算法  6.6 数据挖掘的品种优化算法  6.7 数据挖掘的进化算法 6.1 分类规则挖掘 6.1.1分类与估值 1 分类  为了理解事物特征并做出预测使用历史数据建立 一个分类模型(即分类器)的过程 。  应用于信用卡系统中的信用分级、市场调查、疗 效诊断、寻找店址等  实践应用参照课本 6.1 分类规则挖掘 6.1.1分类与估值 2 估值  估值(estimation )与分类类似,不同之处在于,分类 描述的是离散型变量的输出,而估值处理连续值的输 出;分类的类别是确定的数目,估值的量是不确定的。 3 分类方法与步骤  方法:决策树归纳、贝叶斯分类、贝叶斯网络、神经网络。还有K-最临 近分类、基于案例的推理、遗传算法、粗糙集和模糊集方法 。  步骤:模型创建、模型使用 6.1 分类规则挖掘  6.1.1分类与估值 4 评估分类方法  要考虑的指标:预测准确率、速度、创建速 度、使用速度、鲁棒性、处理噪声和丢失值、 伸缩性、对磁盘驻留数据的处理能力、可解释 性、对模型的可理解程度、规则好坏的评价、 决策树的大小和分类规则的简明性。 6.1 分类规则挖掘 6.1.2 决策树 子节点 父节点 子节点 叶节点 根节点 子节点 叶节点 父节点 子节点 子节点 图6.1 一般决策树结构 mmmm iiii pppp loglogloglog 2222 ((((pipipipi )))) iiii 1111 6.1 分类规则挖掘 6.1.2 决策树 •1.决策树的构造过程 ID3算法应用如下: m (6.1 ) i 信息量计算公式:I(s1,s2,…sm)=- p log 2 (pi ) 其中,pi为si

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档