大数据与统计学知识讲稿.pptVIP

  • 15
  • 0
  • 约8.37千字
  • 约 50页
  • 2019-09-01 发布于天津
  • 举报
涌现性是网络大数据有别于其它数据的关键特性,是大数据动态变化、扩展、演化的结果,表现为模式的涌现性、行为的涌现性和智慧的涌现性,其在度量、研判与预测上的困难使得网络数据难以被驾驭。 模式的涌现性——社会网络模型的变化 行为的涌现性——有较大相似性的个体之间容易建立社会关系,使得网络在演化过程中自发地形成相互分离的连通块。 智慧的涌现性——对来自大量自发个体的语义进行互相融合和连接而形成通用语义,整个过程随着数据的变化而持续演进。 总结:在大数据环境下,传统的高维表达、结构描述和群体行为分析方法不能准确表示网络大数据在异构性、交互性、时效性、突发性等方面的特点,传统的“假设-模型-检验”的统计方法受到了质疑,而从“数据”到“数据”的第四范式还没有真正建立,急需一个新的理论体系来指导,建立新的分析模型。 (三)大数据分析的突破口 大数据分析涉及三个维度——时间、空间和数据本身,其中时间维度又包含生命周期、数据的时间态、流化与增量、时效等元素,空间维度又包含三元空间、粒度、数据传输与迁移、数据空间等元素,数据维度则体现为多源、异质、异构。 如何从三个维度的整体上对大数据的特性与复杂性进行深入的解析,系统掌握大数据的不确定性特征,继而构建高效的大数据计算模型,成为了大数据分析的突破口,具体表现为以下几个方面: 首先,要系统了解大数据的基础性问题

文档评论(0)

1亿VIP精品文档

相关文档