- 27
- 0
- 约1.03万字
- 约 20页
- 2016-12-19 发布于贵州
- 举报
负责这个项目的统计学家辛西亚·鲁丁(Cynthia Rudin)回忆道: 乍看这些数据的时候,我们从未想过能从这些未经处理的数据中找出想要的信息。我打印了一个关于所有电缆的表格。如果把这个表格卷起来的话,除非你在地上拖,不然你绝对提不起它来。而我们需要处理的就是这么多没有处理过的数据。只有理解了这些数据,才能从中淘金,并倾己所有创建一个好的预测模型。 * 2008年,《连线》杂志主编克里斯·安德森(Chris Anderson)就指出:“数据爆炸使得科学的研究方法都落伍了。”后来,他又在《拍字节时代》(The Petabyte Age)的封面故事中讲到,大量的数据从某种程度上意味着“理论的终结”。安德森也表示,用一系列的因果关系来验证各 种猜想的传统研究范式已经不实用了,如今它已经被无需理论指导的纯粹的相关关系研究所取代。 * 接下来看看大数据带给我们思维方式方面的变化。 首先,在以往计算机存储和处理能力较弱的情况下,我们会先对数据进行采样,然后进行处理。采样的不合理会导致预测结果的偏差,在大数据时代,依靠强大的数据处理能力,应该去处理全部的数据。 其次大数据面对的不仅是结构化的数据,而是全部数据,我们要把一切在计算机和网络中存储的信息都当做数据,而不仅仅是数据库中的才是数据。 前面提到大数据应该能够接受错误数据,从实际情况进行预测。 另外,大量案例表明,数据量大小比算法更有效
原创力文档

文档评论(0)