埃森哲大数据分析方法.pptVIP

  • 28
  • 0
  • 约3.47万字
  • 约 66页
  • 2022-07-13 发布于重庆
  • 举报
可选组件 必选 数据挖掘工具-SAS * SAS 系统全称为Statistics Analysis System,最早由北卡罗来纳大学的两位生物统计学研究生编制,并于1976年成立了SAS软件研究所,正式推出了SAS软件。SAS是用于决策支持的大型集成信息系统,SAS 是由大型机系统发展而来,其核心操作方式就是程序驱动,经过多年的发展,现在已成为一套完整的计算机语言,其用户界面也充分体现了这一特点:它采用MDI (多文档界面),用户在PGM视窗中输入程序,分析结果以文本的形式在OUTPUT视窗中输出。使用程序方式,用户可以完成所有需要做的工作,包括统计分析、预测、建模和模拟抽样等。但是,这使得初学者在使用SAS时必须要学习SAS语言,入门比较困难。 BASE SAS模块 SAS/STAT(统计分析模块) SAS/GRAPH(绘图模块) SAS/QC(质量控制模块) SAS/ETS(经济计量学和时间序列分析模块) SAS/OR(运筹学模块) SAS/IML(交互式矩阵程序设计语言模块) SAS/AF(交互式全屏幕软件应用系统模块) SAS/FSP(快速数据处理的交互式菜单系统模块) …… 目前SAS已在全球100多个国家和地区拥有29000多个客户群,直接用户超过300万人。在我国,国家信息中心,国家统计局,卫生部,中国科学院等都是SAS系统的大用户。SAS以被广泛应用于政府行政管理,科研,教育,生产和金融等不同领域,并且发挥着愈来愈重要的作用。 第五十八页,共六十六页。 数据挖掘工具- SPSS Clementine(现已更名为:PASW Modeler ) * Clementine是ISL(Integral Solutions Limited)公司开发的数据挖掘工具平台。1999年SPSS公司收购了ISL公司,对Clementine产品进行重新整合和开发,现在Clementine已经成为SPSS公司的又一亮点。 Clementine的图形化操作界面,使得分析人员能够可视化数据挖掘过程的每一步。通过与数据流的交互,分析人员和业务人员可以合作,将业务知识融入到数据挖掘过程中。这样数据挖掘人员就可以把注意力集中于知识发现,而不是陷入技术任务,例如写代码,所以他们可以尝试更多的分析思路,更深入地探索数据,揭示更多的隐含关系。 使用全面整合到Clementine的Text Mining,您可以从任何类型的文本— 例如内部报告、呼叫中心记录、客户的邮件、媒体或者杂志文章、博客等中抽取内容和评论。使用WebMining for Clementine?,您可以发现访问者网上行为模式。直接获取Dimension产品的调查数据,您可以把人口统计信息、态度和行为信息用于模型—更深入地理解您的客户。Clementine还提供大量的应用模板: CRM CAT--针对客户的获取和增长,提高反馈率并减少客户流失; Web CAT--点击顺序分析和访问行为分析; cTelco CAT--客户保持和增加交叉销售; Crime CAT--犯罪分析及其特征描述,确定事故高发区,联合研究相关犯罪行为; Fraud CAT--发现金融交易和索赔中的欺诈和异常行为; Microarray CAT--研究和疾病相关的基因序列并找到治愈手段 第五十九页,共六十六页。 数据挖掘工具- R * R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的Ross Ihaka和Robert Gentleman。R主要是以命令行操作,同时有人开发了几种图形用户界面。开发(也因此称为R),现在由“R开发核心团队”负责开发。 R内置多种统计学及数字分析功能。R的功能也可以通过安装包(Packages,用户撰写的功能)增强。因为S的血缘,R比其他统计学或数学专用的编程语言有更强的面向对象(面向对象程序设计)功能。 R的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。 虽然R主要用于统计分析或者开发统计相关的软件,但也有人用作矩阵计算。其分析速度可媲美专用于矩阵计算的自由软件GNU Octave和商业软件MATLAB。 第六十页,共六十六页。 数据挖掘工具- Stata * Stata是Statacorp于1985年开发出来的统计程序,在全球范围内被广泛应用于企业和学术机构中。许多使用者工作在研究领域,特别是在经济学、社会学、政治学及流行病学领域。 作为一个小型的统计软件,其统计分析能力远远超过了SPSS,在许多方面也超过了SAS!由于Stata在分析时是将数据全部读入内存,在计算全部完成后 才和磁盘交换数

文档评论(0)

1亿VIP精品文档

相关文档