四、改变统计思维 统计思维的变化应该以一个永恒不变的主题为前提,那就是通过数据分析揭示事物的真相,这个真相就是事物的生存规律、联系规律和发展规律。也就是说要以数据背后的数据去还原事物的本来面目,达到求真的目的。 涌现性是网络大数据有别于其它数据的关键特性,是大数据动态变化、扩展、演化的结果,表现为模式的涌现性、行为的涌现性和智慧的涌现性,其在度量、研判与预测上的困难使得网络数据难以被驾驭。 模式的涌现性——社会网络模型的变化 行为的涌现性——有较大相似性的个体之间容易建立社会关系,使得网络在演化过程中自发地形成相互分离的连通块。 智慧的涌现性——对来自大量自发个体的语义进行互相融合和连接而形成通用语义,整个过程随着数据的变化而持续演进。 总结:在大数据环境下,传统的高维表达、结构描述和群体行为分析方法不能准确表示网络大数据在异构性、交互性、时效性、突发性等方面的特点,传统的“假设-模型-检验”的统计方法受到了质疑,而从“数据”到“数据”的第四范式还没有真正建立,急需一个新的理论体系来指导,建立新的分析模型。 (三)大数据分析的突破口 大数据分析涉及三个维度——时间、空间和数据本身,其中时间维度又包含生命周期、数据的时间态、流化与增量、时效等元素,空间维度又包含三元空间、粒度、数据传输与迁移、数据空间等元素,数据维度则体现为多源、异质、异构
原创力文档

文档评论(0)