数据挖掘实习报告总结计划.docx

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘实习报告 篇一:数据挖掘实习报告 通过半年的实习,我在这里得到了一次较全面的、系统的锻炼,也学到了许多书本上所学不到的知识和技能。以下是我这次的实习鉴定。 经历了实习,对社会也有了基本的实践,让我学到了书本以外的知识,实习期间,我努力尽量做到理论与实践相结合,在实习期间能够遵守工作纪律,不迟到、早退,认真完成领导交办的工作。在实习鉴定中,我参与了整个数据分析工作,从数据获取到数据清洗、数据报表的制定到模型的建立以及模型监控等等,让我充分学习了数据分析岗位的实际操作。 在实习初期,项目经理安排了我参与数据获取的相关工 作,主要是编写 SQL代码在 linux 上用 Perl 语言调用获取数据。起初觉得自己对 SQL语言了解较多,以为这份工作非常简单。但实际操作起来才知道,在数据量达到几百兆甚至 上 GB级别的时候,所学的 SQL 根本解决不了问题。经向项目经理学习,这才知道了如何使用分层次操作等速度较快的 SQL 技巧。通过这两个月的实习充分认识到所学知识远远不 够。 完成数据获取阶段之后,项目经理开始安排数据清洗以及数据报表制定的相关工作。接到这份工作之初,对数据清 洗并没有太多的认识,以为很多都是按照《数据挖掘》教材 中步骤进行就可以的。但经过项目经理指导之后才知道数据 清洗之前首先要对项目业务进行一定的了解,只有清晰了业 务数据的来源、数据的实际意义才知道哪些数据可以称为极 端值,哪些数据又是不正常的,制定报告或者交给模型分析 师时需要去除的等等。同时,在制定数据报表的同时学习了 很多 excel 函数的使用,透视表的使用, PPT报告的书写等 等。 在实习的后三个月,开始接触了模型的分析与监控。在学习《机器学习》以及《数据挖掘》书本时,总会想到各种各样的分类模型,也总会认为模型准确率高的模型才会是好模型。在运用统计模型之前,项目经理首先向实习生介绍了目前挖掘部门常用的分类模型以及具体的一些使用方法。其中逻辑回归模型、决策树模型是常用的分类模型,回归分析和时间序列模型是常用的预测模型,这与平日所学基本一致。正当好奇为什么不使用支持向量机以及神经络模型之时,项目经理说,由于模型结果都是要给市场部门的同事报告的,所以模型结果最好能够简单易懂的。在实际工作才知道,一般除了用模型准确率来衡量模型的效果外,还有例如灵敏度、ROC曲线、 RA曲线等等指标值。而模型的操作过程也不是想象的那么简单,并不是用 R 软件上的几个函数,几行代码就 能解决的,选择什么参数、选择什么样的模型,当然最重要 的还是选择什么样的基础数据作为模型的训练数据才是最 重要的,这才发现项目经理之前提到的业务知识是多么的重 要。 在模型建立之后就是模型监控了,由于是我负责的项目,所以项目经理也将监控这一任务交给了我。数据挖掘模型通常情况下都是要上线的,但模型的效果会随着数据的变化而变化,当模型的指标达到一定程度时就需要修改模型。在这一阶段,充分锻炼了我的程序编写能力。 在整一个实习过程,非常感谢项目经理给予了我数据挖掘整一个流程学习的机会,让我真正对数据挖掘的实际工作有了一定的认识,也让我学习到了很多学校学习中学不到的实际操作能力,在此表示衷心的感谢。 篇二:数据挖掘实验报告 经贸学院 市场营销专业 数据挖掘管理实验报告 实验名称: 数据挖掘—聚类分析 实验时间: XX年 12 月 21 日 班 级 11252 姓名潘宏 学 号 1125219 成 绩 指导老师 王林 一、数据建模过程 1、启动 SPSS 双击窗口底部节点选项板中的“源”中的 statistics 文件建立文件,如图 1。 图 1 2、右击 statistics 文件编辑,如图 2。 图 2 3、点击省略号其中一个选择文件打开。单击应用并确 定,如图 3 和 图 3 图 4 4、双击输出选项中的表节点,如图 5 所示,表节点出 现在工作区中。 图 5 5、如图 6 所示,右击运行表节点。可以看到图中关 于客户资产购 平台价值的数据记录。该数据包含 A1, A2 等字段。 图 6 6、如图 7,在字段选项中双击类型节点,则类型节点出 现在工作表 中。 图 7 7、如图 8,右击类型节点选择编辑,则出现一张关于 字段的表,将所有字段角色项设为“输入” ,这表示要将所 有字段进行聚类分析。 最后点击应用、确定。 图 8 篇三:《数据挖掘实训》 weka 实验报告 论文(报告、案例分析) 院系 信息学院专业 统计班 级10 级统计 班学生姓名李健学 号 XX210453 任课教师 刘 洪伟  3 XX年  01  月  17 日 课程论文评分表 《数据挖掘实训》课程论文 选题要求: 根据公开发表统计数据,请结合数据挖掘理论与方法, 撰写一篇与数据挖掘领域相关的论文。 写作要求: 1)

文档评论(0)

187****4751 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档