Excel、Spss、R在数据探析中比较探究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Excel、Spss、R在数据探析中比较探究

Excel、Spss、R在数据探析中比较探究   摘要:随着大数据时代的到来,数据分析成了一个热门的话题。市场上有各种各样的数据分析工具,如何选择数据分析工具就成了很多数据分析工作者的一个难题。而数据分析工具的选择应主要依据具体的业务逻辑,并没有最好的数据分析工具,而只有最适合的分析工具。全文选择Excel,Spss和R语言这三个数据分析工具进行比较分析。观察他们在平时的学习和工作中,特别是在数据分析过程中的表现,以得出他们最适合的工作环境 关键词: 大数据;分析工具;业务逻辑;比较分析;工作环境 中图分类号:TP317.3 文献标识码:A 文章编号:1009-3044(2017)04-0235-02 统计分析软件是数据分析的主要工具。无论在工作还是学习中,我们都需要使用这些软件来进行数据分析,而分析的过程主要分为数据的整理,数据的分析,数据的报告 。而市场上有很多的软件来供我们选择,如何选择一款合适的软件就成了我们需要考虑的问题 1 工具简介 Excel是微软的office系列办公软件中比较常用的一款数据处理软件。我们可以通过Excel进行数据录入,储存和分析的相?P操作。Excel提供了大量的函数功能,为我们的数据分析工作提供了便捷。而且强大的VBA编程能力,也让我们处理起数据更加个性化和多样化 Spss(Statistical Product and Service Solutions),相比Excel这样的办公软件,人们更加倾向于称Spss为统计软件。因为它的数据处理能力更加强大,Excel只能做一些最基本的数据操作,而Spss则可以做一些比较高级的数理统计工作 R语言(R Language)相比前两者最大的不同之处在于他是非窗口操作软件,更确切地说他是一款脚本语言。用户需要输入相应的指令才可以操作数据。R语言的强大之处在于他的包。R语言平台上提供了各种各样的数理统计包,这些包可以直接由用户使用,而并不用关心它的底层实现机制 2 三种软件在数据储存阶段的比较分析 数据存储是指分析员在搜集数据之后,把相应的数据有条理的储存起来,以便在以后的分析工作中使用。数据存储是数据处理过程的第一个阶段,也是最重要的阶段,因为他直接影响着以后的操作。如果在数据的存储阶段出了问题,那么整个数据分析的过程也就是有问题的。可见数据存储过程是需要分析员特别重视的阶段 在此阶段Excel和Spss提供了可视化的操作界面,所以分析员可以很容易的对数据进行录入处理。而R语言则没有提供相应的图形操作界面,分析员只能通过在控制台建立数据框这样的方式,把数据储存起来。可视化操作界面的优点是直观,分析员可以像在实体的纸质表格上写字一样在虚拟的表里填入数据,这样可以减少分析员在抽象脚本语言可能出现的失误 虽然R没有提供简单的图形操作界面,使得数据的输入没有Excel与Spss软件这么直观,但是R语言这种输入方式却有一个比较强势的功能,就是编程。虽然Excel和Spss也有编程功能,但是语法过于复杂。在R语言中分析员可以编写自己的脚本文件,实现数据的重复录入,从而可以节省出大量的时间,减少不必要的时间浪费 他们三者最后都可以把数据保存为CSV格式或者TXT格式,这样就为数据的传输带来了方便。保存为这两种格式后三个软件可以实现数据的共享操作 综上所述,Excel和Spss强在可视化的操作界面,而R语言则强在编程语言。至于最后数据的保存,三者则表现出了一致性,实现了数据在软件之间的传输 3 三种软件在数据分析阶段的比较分析 数据分析传统上都认为是统计分析,而广义的数据分析则包含了更高级的算法比如机器学习、数据挖掘等。数据挖掘(Data Minning)是指从大量的数据中通过一些特定的算法,计算出隐藏在其中的有意义的信息的过程。主要的数据挖掘算法包括:人工神经网络,支持向量机,KNN算法,随机深林、决策树、回归分析等 Excel在数据分析阶段的强大之处在于它有很强大的函数库,利用这些函数库里的函数,可以帮助我们方便地进行简单的数据分析,比如求平均数,求和等。当然也可以对数据进行优化和筛选。函数功能是Excel的灵魂,有了函数,Excel就可以组合变化出多种统计方式,来分析数据 但是,Excel只能进行简单的数理统计分析,而不能进行比较高级的算法分析。 Spss相比Excel则可进行比较高级的数据分析,比如生存分析、Logistic回归、BP神经网络等。虽然Spss能进行这些算法分析,但是它本身也有局限性。由于Spss是一款可视化软件,它的载体在软件开发的阶段就已经被设计好了,分析员很难再根据自己的需要对里面的算法进行更改。这也就意味着,分析员只能使用设计者提供的方法,而设计者没有提供的方法

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档