- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
数据挖掘技术的应用——以空调冷冻站设备为例
(利用Excel数据分析建模——示例讲解录像)
以中央空调冷冻站冷水机组、冷冻泵、冷却泵为例,示例通过历史运行数据,利用Excel中的数据分析功能,通过选定参数对能耗、能效等特性进行回归分析、判断回归质量指标值、获得模型与模型验证的基本方法
内容
数据挖掘及其流程
冷水机组能耗与COP模型挖掘
冷冻泵扬程、能耗与效率模型挖掘
冷却泵扬程、能耗与效率模型挖掘
延伸拓展:
数据分析与挖掘概述/Android_xue/article/details一个完整的数据分析、挖掘流程详细介绍/Together_CZ/article/details一、数据挖掘及其流程
数据挖掘则广泛交叉数据库知识、统计学、机器学习、人工智能等方法,对搜集来的数据进行“采矿”,发现其中未知的规律和有用的知识,进一步应用于数据化运营,让数据产生更大的价值。
数据挖掘更侧重于技术的实现,对业务知识的熟练度并没有很高的要求,如何从海量的数据中发现未知的模式和规律,是数据挖掘的目的所在,只有技术过硬,才能实现挖掘项目的落地。
数据挖掘更多的是模型或规则的输出,通过模型或规则可对未知标签的数据进行预测,如预测交通的畅通度(预测模型)、判别用户是否响应某种营销活动(分类算法);通过模型或规则实现智能的商业决策,如推荐用户可能购买的商品(推荐算法)、划分产品所属的群类(聚类算法)等。
数据挖掘与数据分析的对比
对比角度
数据分析
数据挖掘
定义
描述和探索性分析,评估现状和修正不足
技术性的“采矿”过程,发现未知的模式和规律
侧重点
实际的业务知识
挖掘技术的落地,完成“采矿”过程
技能
统计学、数据库、Excel、可视化等
过硬的数学功底和编程技术
结果
需结合业务知识解读统计结果
模型或规则
数据挖掘的流程
据不完全统计,建模前的数据准备将占整个数据挖掘流程80%左右的时间,可谓“地基不牢,地动山摇”。
常用的数据分析与挖掘工具
R语言
R语言是由奥克兰大学统计系的RobertGentleman和RossIhaka共同开发的,并在1993年首次亮相。其具备灵活的数据操作、高效的向量化运算、优秀的数据可视化等优点,受到用户的广泛欢迎。近年来,由于其易用性和可扩展性也大大提高了R语言的知名度。同时,它也是一款优秀的数据挖掘工具,用户可以借助强大的第三方扩展包,实现各种数据挖掘算法的落地。
Python
Pyhton是由荷兰人GuidovanRossum于1989年发明的,并在1991年首次公开发行。它是一款简单易学的编程类工具,同时,其编写的代码具有简洁性、易读性和易维护性等优点,也受到广大用户的青睐。其原本主要应用于系统维护和网页开发,但随着大数据时代的到来,数据挖掘、机器学习、人工智能等技术越发热门,进而促使了Python进入数据科学的领域。Python同样拥有各种五花八门的第三方模块,用户可以利用这些模块完成数据科学中的工作任务。例如,pandas、statsmodels、scipy等模块用于数据处理和统计分析;matplotlib、seaborn、bokeh等模块实现数据的可视化功能;sklearn、PyML、keras、tensorflow等模块实现数据挖掘、深度学习等操作。
Weka
Weka由新西兰怀卡托大学计算机系IanWritten博士于1992年末发起开发,并在1996年公开发布Weka2.1版本。它是一款公开的数据挖掘平台,包含数据预处理、数据可视化等功能,以及各种常用的回归、分类、聚类、关联规则等算法。对于不擅长编程的用户,可以通过Weka的图形化界面完成数据分析或挖掘的工作内容。
SAS
SAS是由美国北卡罗来纳州大学开发的统计分析软件,当时主要是为了解决生物统计方面的数据分析。在1976年成立SAS软件研究所,经过多年的完善和发展,最终在国际上被誉为统计分析的标准软件,进而受到各个领域的广泛应用。SAS由数十个模块构成,其中Base为核心模块,主要用于数据的管理和清洗、GHAPH模块可以帮助用户实现数据的可视化、STAT模块则涵盖了所有的实用统计分析方法、EM模块则是更加人性化的图形界面,通过托拉拽的方式实现各种常规挖掘算法的应用。
SPSS
SPSS是世界上最早的统计分析软件,最初由斯坦福大学的三个研究生在1968年研发成功,并成立SPSS公司,而且在1975年成立了SPSS芝加哥总部。用户可以通过SPSS的界面实现数据的统计分析和建模、数据可视化及报表输出,简单的操作受到了众多用户的喜爱。除此之外,SPSS还有一款Modeler工具,其前身是Clementine,2009年被IBM收购后,对其性能和功能做了大幅的改进和提升。该工具充分体现了数据挖掘
您可能关注的文档
- 8-14 识读阳台详图(下)(改版).pptx
- 7-7投资偏差分析.pptx
- 7构件入场检验.pptx
- 7简捷法绘制轴力图1.pptx
- 7-某宿舍楼电气安装工程施工图预算实训-配管配线工程量计算 (1).pptx
- 7-某综合楼通风空调安装工程招标控制价实训-综合单价分析表.ppt
- 7三次超静定算例 (1).pptx
- 7外伸梁支座反力影响线.pptx
- 7-显示标高和轴网 (1).ppt
- 08 工程结算与竣工决算.ppt
- 一年级下英语教案-Unit 1 I Love My Family-广州版(一起).docx
- 五年级上册英语导学案-Unit6 In a nature park A Let's learn 人教pep.docx
- 部编版语文二年级上册13 《寒号鸟》第一课时(教学设计).docx
- 四年级下册数学教案-《三角形的分类》教学设计 人教新课标.docx
- Module 1 Colours Unit 1 I like red 第2课时(教案)-2023-2024学年英语三年级下册.docx
- 五年级上册语文教案(含反思).docx
- 全册教案(教案)二年级下册数学人教版.docx
- 五年级下册语文 教学设计—22 手指(部编版).docx
- 【教案】四年级下册英语Unit 3 All about Me (Lesson15)冀教版(三起).docx
- Unit 1 Lesson 4 Horses and Rabbits(教案)冀教版(三起)英语三年级下册.docx
文档评论(0)