数据挖掘及决策树.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
昆明理工大学信息工程与自动化学院学生实验报告 (2016 —2017 学年第 学期) 课程名称:数据库房与数据挖掘 开课实验室:信自楼444 2017 年06 月01 日 年级、专业、班 软件141班 学号31XX 姓名 陈* 成绩 实验项目名称 数据挖掘及决议树 指导教师 贾连印 教 该同学是否认识实验原理: A.认识□ B.基本认识□ C.不认识□ 师 该同学的实验能力: A.强□ B.中等 □ C.差 □ 该同学的实验是否达到要求: A.达到□ B.基本达到□ C.未达到□ 评 实验报告是否规范: A.规范□ B.基本规范□ C.不规范□ 实验过程是否详尽记录: A.详尽□ B.一般 □ C.没有□ 语 教师署名: 年 月 日 一、上机目的及内容 目的: 1.理解数据挖掘的基本观点及其过程; 2.理解数据挖掘与数据库房、OLAP之间的关系 3.理解基本的数据挖掘技术与方法的工作原理与过程,掌握数据挖掘有关工具的使用。 内容: 给定AdventureWorksDW数据库房,建立“Microsoft决议树”模型,剖析客户群中购置自行车的模式。 要求: 利用实验室和指导教师提供的实验软件,仔细达成规定的实验内容,真切地记录实验中碰到的 二、实验原理及基本技术路线图(方框原理图或程序流程图) 请描绘数据挖掘及决议树的有关基本观点、模型等。 数据挖掘:从大量的、不完全的、有噪音的、模糊的、随机的数据中,提取隐含在其中的、人们预先不知道的、但又潜在有用的信息和知识的过程。 数据挖掘的功能: 功能观点或作用 观点描绘对某类对象的内涵进行描绘,并归纳这类对象的有关特点 关系剖析从大量的数据中发现项集之间有趣的联系、有关关系或因果结构,以及 项集的频繁模式 分类与预测分类:提出一个分类函数或许分类模型,该模型能把数据库中的数据项 映射到给定类型中的一个; 预测:利用历史数据成立模型,再运用最新数据作为输入值,获得未来 变化趋势或许评估给定样本可能拥有的属性值或值的范围 聚类剖析根据数据的不同特点,将其区分为不同数据类 偏差剖析对差别和极端特例的描绘,揭露事物偏离惯例的异样现象,其基本思想 是寻找观察结果与参照值之间存心义的差别 决议树:是一种预测模型,它代表的是对象属性与对象值之间的一种映射关系。树中每个节点表示某个对象,而每个分叉路径则代表的某个可能的属性值,而每个叶结点则对应从根节点到该叶节点所经历的路径所表示的对象的值。决议树仅有单调输出,若欲有复数输出,能够成立独立的决议树以办理不同输出。 常用决议树算法: 算法观点 ID3在实体世界中,每个实体用多个特点来描绘。每个特点限于在一 个离散集中取互斥的值 对ID3算法进行了改良: 用信息增益率来选择属性,战胜了用信息增益选择属性时偏向选 择取值多的属性的不足;在树结构过程中进行剪枝;能够达成对 连续属性的离散化办理;能够对不完整数据进行办理。 三、所用仪器、材料(设施名称、型号、规格等或使用软件) 1台PC及MicrosoftSQLServer套件 四、实验方法、步骤(或:程序代码或操作过程) (一)准备AnalysisServices数据库 1.AnalysisServices项目创立成功 更改存储数据挖掘对象的实例 创立数据源 改正数据源视图 (二)生成目标邮件方案 创立用于目标邮件方案的挖掘结构 改正目标邮件模型 创立聚类剖析挖掘模型NaiveBayes模型办理挖掘模型 (三)决议树 (四)依靠关系网络 五、实验结果(测试数据、图表、计算等) 决议树 六、剖析和结论(误差剖析与数据办理、成就总结等。其中,绘制曲线图时必须用计算纸或程序运行结果、改良、收获) 在本次实验中,在成立数据源视图时,多次出现错误,以后发现是因为未附加数据库的原因,附加数据库后解决了。 因为实验没有达成就封闭了电脑,重启电脑后,出现无法连结的错误,后经过管理界面启动服务后解决。 在部署时,出现由于“创立用于目标邮件方案的挖掘结构”中“内容种类”的设置没有严格按照教程来,致使后续有继承键而无法部署,从头设置更改后才得以解决。 本次实验都只是按照丛书教程里弄的,还不太深入理解其中的知识和有关理论,相信在此后的生活、学习和实践中,慧能更好的去掌握决议树。

文档评论(0)

152****7128 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档