数据可视化技分析ppt.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
China * China * China * China * China * 返回 大数据环境下数据可视化 大规模网络中,随着海量节点和边的数目不断增多,例如规模达到百万以上时,可视化界面中会出现节点和边大量聚集、 重叠和覆盖问题,使得分析者难以辨识可视化效果.图简化(graph simplification)方法是处理此类大规模图可视化的主要手段: ? 一类简化是对边进行聚集处理,例如基于边捆绑(edge bundling)的方法,使得复杂网络可视化效果 更为清晰,下图展示了 3 种基于边捆绑的大规模密集图可视化技术.此外,Ersoy 等人还提出了基于骨架的图可视化技术,主要方法是根据边的分布规律计算出骨架,然后再基于骨架对边进行捆绑; 返回 大数据环境下数据可视化 ? 另一类简化是通过层次聚类与多尺度交互,将大规模图转化为层次化树结构,并通过多尺度交互来对 不同层次的图进行可视化.例如,如图所示的 ASK-Graphview 能够对具有 1 600 万条边的图进行分 层可视化. 这些方法技术将为大数据时代大规模图可视化提供有力的支持,同时我们应该看到,交互技术的引入,也将 是解决大规模图可视化不可或缺的手段 返回 大数据环境下数据可视化 时空数据是指带有地理位置与时间标签的数据.传感器与移动终端的迅速普及,使得时空数据成为大数据时代典型的数据类型.时空数据可视化与地理制图学相结合,重点对时间与空间维度以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示.大数据环境下时空数据的高维性、实时性等特点,也是时空数据可视化的重点. 返回 大数据环境下数据可视化 为了反映信息对象随时间进展与空间位置所发生的行为变化,通常通过信息对象的属性可视化来展现.流式地图 Flow map 是一种典型的方法,将时间事件流与地图进行融合,下图 显示了使用 Flow map 分别对 1864年法国红酒的出口情况以及拿破仑进攻俄罗斯的情况可视化的例子. 返回 大数据环境下数据可视化 散点图 (scatter plot) 是最为常用的多维可视化方法,二维散点图将多维中的两个维度属性值集合映射至两条轴,在二维轴确定的平面内通过图形标记的不同视觉元素来反映其他维度属性值,例如,可通过不同形状、颜色、尺寸等来代表连续或离散的属性值。 如下图所示.二维散点图能够展示的维度十分有限。 研究者将其扩展到三维空间,通过可旋转的 Scatter plot 方块(dice)扩展了可映射维度的数目,如下图中右图所示.散点图适合对有限数目的较为重要的维度进行可视化,通常不适于需要对所有维度同时进行展示的情况. 返回 大数据环境下数据可视化 投影(projection) 是能够同时展示多维的可视化方法之一.如左图所示,VaR 将各维度属性列集合通过投影函数映射到一个方块形图形标记中,并根据维度之间的关联度对各个小方块进行布局. 基于投影的多维可视化方法一方面反映了维度属性值的分布规律,同时也直观展示了多维度之间的语义关系. 平行坐标(parallel coordinates) 是研究和应用最为广泛的一种多维可视化技术,如右图 所示,将维度与坐 标轴建立映射,在多个平行轴之间以直线或曲线映射表示多维信息.近年来,研究者将平行坐标与散点图等其他可视化技术进行集成,提出了平行坐标散点图 PCP(parallel coordinate plots). 返回 问题与挑战 (1)多源、异构、非完整、非一致、非准确数据的集成与接口 大数据可视化所依赖的基础是数据,而大数据时代数据的来源众多。且对来自于异构环境,即使获得数据源,得到的数据的完整性、一致性、准确性都难以保证。数据质量的不确定问题将直接影响可视化分析的科学性和准确性,大数据可视化的前提是建立在集成的数据接口,并且与可视化分析系统形成松耦合的接口关系,以供各种可视化算法方便的调用,使得可视化分析系统的研发者和使用者不需要关系数据接口背后的复杂机理。 返回 问题与挑战 (2)可扩展性问题 大数据的数据规模目前已经呈现爆炸式增长,数据量的无限积累与数据的持续演化,导致普通计算机的处理能力难以达到理想的范围,同时主流显示设备的像素数也难以跟上大数据增长的脚步,造成像素的总和还不如要可视化的数据多而且,大量在较小的数据规模下可行的可视化技术在面临极端大规模数据时讲无能为力。 所以,大数据可视化分析系统应该具有较好的可扩展性,即感知扩展性和交互扩展性只取决于可视化的精度而不是依赖数据规模的大小,以支持实时的可视化与交互操作。因此,未来如何面对超高维数据的降维以降低数据规模,如何结合大规模并行处理方法与超级计算机,如何将目前有价值的可视化算法和人机交互技术提升和拓展到大数

文档评论(0)

jiupshaieuk12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:6212135231000003

1亿VIP精品文档

相关文档