- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据挖掘技术的应用——以空调冷冻站设备为例
(利用Excel数据分析建模——示例讲解录像)
以中央空调冷冻站冷水机组、冷冻泵、冷却泵为例,示例通过历史运行数据,利用Excel中的数据分析功能,通过选定参数对能耗、能效等特性进行回归分析、判断回归质量指标值、获得模型与模型验证的基本方法
内容
数据挖掘及其流程
冷水机组能耗与COP模型挖掘
冷冻泵扬程、能耗与效率模型挖掘
冷却泵扬程、能耗与效率模型挖掘
延伸拓展:
数据分析与挖掘概述/Android_xue/article/details一个完整的数据分析、挖掘流程详细介绍/Together_CZ/article/details一、数据挖掘及其流程
数据挖掘则广泛交叉数据库知识、统计学、机器学习、人工智能等方法,对搜集来的数据进行“采矿”,发现其中未知的规律和有用的知识,进一步应用于数据化运营,让数据产生更大的价值。
数据挖掘更侧重于技术的实现,对业务知识的熟练度并没有很高的要求,如何从海量的数据中发现未知的模式和规律,是数据挖掘的目的所在,只有技术过硬,才能实现挖掘项目的落地。
数据挖掘更多的是模型或规则的输出,通过模型或规则可对未知标签的数据进行预测,如预测交通的畅通度(预测模型)、判别用户是否响应某种营销活动(分类算法);通过模型或规则实现智能的商业决策,如推荐用户可能购买的商品(推荐算法)、划分产品所属的群类(聚类算法)等。
数据挖掘与数据分析的对比
对比角度
数据分析
数据挖掘
定义
描述和探索性分析,评估现状和修正不足
技术性的“采矿”过程,发现未知的模式和规律
侧重点
实际的业务知识
挖掘技术的落地,完成“采矿”过程
技能
统计学、数据库、Excel、可视化等
过硬的数学功底和编程技术
结果
需结合业务知识解读统计结果
模型或规则
数据挖掘的流程
据不完全统计,建模前的数据准备将占整个数据挖掘流程80%左右的时间,可谓“地基不牢,地动山摇”。
常用的数据分析与挖掘工具
R语言
R语言是由奥克兰大学统计系的RobertGentleman和RossIhaka共同开发的,并在1993年首次亮相。其具备灵活的数据操作、高效的向量化运算、优秀的数据可视化等优点,受到用户的广泛欢迎。近年来,由于其易用性和可扩展性也大大提高了R语言的知名度。同时,它也是一款优秀的数据挖掘工具,用户可以借助强大的第三方扩展包,实现各种数据挖掘算法的落地。
Python
Pyhton是由荷兰人GuidovanRossum于1989年发明的,并在1991年首次公开发行。它是一款简单易学的编程类工具,同时,其编写的代码具有简洁性、易读性和易维护性等优点,也受到广大用户的青睐。其原本主要应用于系统维护和网页开发,但随着大数据时代的到来,数据挖掘、机器学习、人工智能等技术越发热门,进而促使了Python进入数据科学的领域。Python同样拥有各种五花八门的第三方模块,用户可以利用这些模块完成数据科学中的工作任务。例如,pandas、statsmodels、scipy等模块用于数据处理和统计分析;matplotlib、seaborn、bokeh等模块实现数据的可视化功能;sklearn、PyML、keras、tensorflow等模块实现数据挖掘、深度学习等操作。
Weka
Weka由新西兰怀卡托大学计算机系IanWritten博士于1992年末发起开发,并在1996年公开发布Weka2.1版本。它是一款公开的数据挖掘平台,包含数据预处理、数据可视化等功能,以及各种常用的回归、分类、聚类、关联规则等算法。对于不擅长编程的用户,可以通过Weka的图形化界面完成数据分析或挖掘的工作内容。
SAS
SAS是由美国北卡罗来纳州大学开发的统计分析软件,当时主要是为了解决生物统计方面的数据分析。在1976年成立SAS软件研究所,经过多年的完善和发展,最终在国际上被誉为统计分析的标准软件,进而受到各个领域的广泛应用。SAS由数十个模块构成,其中Base为核心模块,主要用于数据的管理和清洗、GHAPH模块可以帮助用户实现数据的可视化、STAT模块则涵盖了所有的实用统计分析方法、EM模块则是更加人性化的图形界面,通过托拉拽的方式实现各种常规挖掘算法的应用。
SPSS
SPSS是世界上最早的统计分析软件,最初由斯坦福大学的三个研究生在1968年研发成功,并成立SPSS公司,而且在1975年成立了SPSS芝加哥总部。用户可以通过SPSS的界面实现数据的统计分析和建模、数据可视化及报表输出,简单的操作受到了众多用户的喜爱。除此之外,SPSS还有一款Modeler工具,其前身是Clementine,2009年被IBM收购后,对其性能和功能做了大幅的改进和提升。该工具充分体现了数据挖掘
文档评论(0)