- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三章 计算机在环境工程研究与管理中的应用 3.1 计算机在数据处理中的应用技术 3.2 计算机在数据管理中的应用技术 3.1 计算机在数据处理中的应用技术 3.1.1 环境统计 3.1.2 数据挖掘 3.1.3 SPSS的使用 3.1.4 Excel的使用 3.1.1环境统计的基本任务 环境统计是社会经济统计的重要组成部分。其基本任务是根据环境保护工作的要求,通过一整套环境统计指标体系,采用统一的科学方法,摸索整理环境管理与环境建设方面的大量数据,并经过统计分析来反映环境状况,为环境管理、污染治理和环境预测等提供依据。 企业环境统计的作用是通过对统计数据进行认真的分析、研究,从中找出规律性,判明污染发展趋势,为领导决策和对污染源实行有效治理提供切实可行的建议。 3.1.2数据挖掘(data mining) 数据挖掘是指在大型数据库中寻找你感兴趣或是有价值信息的过程。 数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据集中识别有效的、新颖的、潜在有用的,以及最终可理解的模式的非平凡过程。 它是一门涉及面很广的交叉学科,包括机器学习、数理统计、神经网络、数据库、模式识别、粗糙集、模糊数学等相关技术。 (1)数据挖掘的方法 根据数据挖掘的方法分,可粗分为:统计方法、机器学习方法、神经网络方法和数据库方法。 统计方法中,可分为:回归分析(多元回归、自回归等)、判别分析(贝叶斯判别、费歇尔判别、非参数判别等)、聚类分析(系统聚类、动态聚类等)、探索性分析(主元分析法、相关分析法等)、以及模糊集、粗糙集、支持向量机等。 (1)数据挖掘的方法 机器学习中,可细分为:归纳学习方法(决策树、规则归纳等)、基于范例的推理CBR、遗传算法、贝叶斯信念网络等。 神经网络方法,可细分为:前向神经网络(BP算法等)、自组织神经网络(自组织特征映射、竞争学习等)等。 数据库方法主要是基于可视化的多维数据分析或OLAP方法,另外还有面向属性的归纳方法。 (2)数据挖掘的进化历程 (3)数据挖掘的应用 数据挖掘解决的是典型商业问题 需要强调的是,数据挖掘技术从一开始就是面向应用的。 (3)数据挖掘的应用 目前,在很多领域,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域。 数据挖掘所能解决的典型商业问题包括: 数据库营销(Database Marketing) 客户群体划分(Customer Segmentation Classification) 背景分析(Profile Analysis) 交叉销售(Cross-selling)等市场分析行为, 客户流失性分析(Churn Analysis) 客户信用记分(Credit Scoring) 欺诈发现(Fraud Detection)等等。 (4) 数据挖掘相关软件 SPSS, Statistical?Product?and?Service?Solutions SAS,Statistics?Analysis?System S-PLUS Statistica Minitab (1)SPSS “在信息爆炸的今天,您正在从事着什么?数据收集、数据存取和管理、数据分析、数据检验、数据挖掘、数据展示等等一系列的问题是否让您头晕脑胀?” SPSS, Statistical?Product?and?Service?Solutions ,意为“统计产品与服务解决方案”,是世界上最早的统计分析软件,由美国斯坦福大学的三位研究生于20世纪60年代末研制。 (1)SPSS SPSS的自动统计绘图、数据的深入分析、使用方便、功能齐全等方面给受到了高度的评价与称赞。迄今SPSS软件已有30余年的成长历史,全球约有25万家产品用户。 多应用于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件,极大地方便了中、高级用户。 SPSS SPSS最突出的特点就是操作界面极为友好,输出结果美观漂亮(从国外的角度看),它使用Windows的窗口方式展示各种管理和分析数据方法的功能,使用对话框展示出各种功能选择项,只要掌握一定的Windows操作技能,粗通统计分析原理,就可以使用该软件为特定的科研工作服务,是非专业统计人员的首选统计软件。 SPSS 在众多用户对国际常用统计软件SAS、BMDP、GLIM、GENSTAT、EPILOG、MiniTab的总体印象分的统计中,其诸项功能均获得最高分 。 SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便地从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。 对于熟悉老版编程运行方式的用户,
文档评论(0)