试论大数据统计的新思维.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
试论大数据统计的新思维.doc

试论大数据统计的新思维 摘要:大数据给互联网带来的是前所未有的信息大爆炸,不仅改变了从前互联网的数据应用模式,还影响了人们的生活方式。处于大数据时代的人们认识到了大数据已经将数据分析从向后分析转变成向前分析,从而改变了人们的思维方式,但同时也提出了一些挑战,在解决问题的同时也意味着大数据开始向纵深方向发展。 关键词:大数据;统计学;统计思维;数据应用模式;数据分析 文献标识码:A 中图分类号:C829 文章编号:1009-2374(2015)09-0048-02 DOI:10.13535/j.cnki.11-4406/n.2015.0779 1 对大数据的初步认识 首先我们需要知道什么是大数据,它在不同的科学领域、不同的行业都有不同的解释。相对于传统意义上的数据,大数据这里的含义有新的解释,不只是字面本身的意思,更为重要的是数据的内涵,可能“大”与“数据”的含义本就不能分开理解,只有把“大数据”这三个字放在一起才能更有意义。从统计学的角度出发我们应该怎样来理解大数据呢?它是在现代信息技术、工具的基础上运用可自动记录、储存能力的所有类型的数据。简单地说,大数据就是所有的可记录信息的集合。可以这样来理解,把以前的统计研究数据比做是根据一定条件收集在一起的结构化的样本,那大数据就是所有可以记录、存储、超大容量的各种各样类型的数据总集合。从统计学的角度出发,传统的样本数据与现今的大数据的区别在哪呢?区别就在于传统的样本数据是按特定的条件所产生的格式化数据,样本的数量是有限的,而且如果说统计设计过程偏离了方案,数据就失去意义。一般都不可能同时满足各方面统计需求,如果出现了其事先未考虑到的情况,数据的不能扩展性就会导致数据的失效,那统计方案也就失效了。而大数据是所有可能通过现代信息科技手段可获得的数据,其数据量巨大,并且不会受到一些条件的限制。因此,大数据最大的优势就是非常宽的数据选择性,可进行多维度、多角度的数据分析方案。更为重要的是因为大数据的样本选择面宽,样本如果不够说明情况还可以从大数据中选择扩大;样本中不能够发现的某些细小信息,在大数据也可以获得。 2 统计思维的新变化 在大数据时代要想做好统计工作,需要改变统计思维,否则,统计工作很难发展,至少会被边缘化。统计思维的变化应该从对数据的掌握与分析开始,下一步是揭示事物的本质与相互联系,直至揭示事物的发展规律。也可以说统计工作的目的就是要还原事物的本来面目,从而达到还原真相的效果。 2.1 认识数据的思维要变化 与传统样本数据相比,大数据不仅数量多和选择多,而且其来源和数据类型都发生了根本性的变化,数据既杂乱又多样。首先,从根源来讲,传统的样本数据的收集对象较特定,所以数据的特征都非常明显并可以识别,还可以进行事后的核对检验。但大数据则不同,它们来源于网络,其数据并不是为了特定事物收集而产生的,而是一切可记录的数据,所以说大数据的来源是没有针对性的。其次,从类型来看,传统样本数据一般都是结构型数据,有一定格式标准,可以运用常规统计指标或者统计图表来表示。而大数据大多是非结构型且无任何针对性的数据,既包括可记录的和可存储的信号,又没有标准、多样化,过去的统计指标或图表来表现比较困难。最后,从运用方式上看,传统样本数据的处理有一整套方法可行,其结果可以直接使用。但是大数据中的数据怎样与结构化数据对接则是一个崭新的问题。 2.2 收集数据的思维要变化 以往收集统计数据的方法是先确定统计研究目的,再根据统计目的收集数据,因此设计调查方案及设计统计流程就显得十分必要,有时投入的人力物力较大而产出数据十分有限。现在则不同了,在大数据时代,有大量的可选择数据,需要做的环节就是加以比较与筛选,我们需要考虑的应该是怎样利用大数据的优势,在大数据源中找到我们需要东西。当然,也不是所有数据都可以从互联网中找到,中间存在一个再加工或成本比较的问题。所以,有时运用大数据的同时也需要采用一些传统的统计方法来收集特殊的数据,再利用互联网信息技术的强大功能去收集一些相关的数据进行过滤、选择。 2.3 对数据的分析思维要有新变化 针对上述两方面内容发生的变化,对统计数据分析的思维必然要做出调整,这就需要我们尽可能地利用信息技术或先进的技术方法从大数据中找出对我们有价值的信息,并在这个过程中丰富统计科学的方法。主要体现在以下三点: 首先,过去的统计分析方法是先定性,再定量,最后定性。它的意义是为了找准统计方向和目标,运用的是以往经验的判断,这些在以前统计数据分析手段方法较落后的情况下是很重要的。而在信息时代,我们只需要在大数据中找出相应的资料,直接依靠数据分析方法做出统计判断,这种方法在存储能力无限增大、统计分析方法和实现速度大大改善的现在,已经变得可以实现了,因此我们更需要做的就是直接从中找出真正需要的数据,就可得

文档评论(0)

jingpinwedang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档