- 1、本文档共32页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
China * China * China * China * China * China * China * China * * 返回 大数据环境下数据可视化 对于具有层次特征的图,空间填充法也是常采用的可视化方法,例如树图技术 Treemaps 及其改进技术,如图 所示是基于矩形填充、Voronoi 图填充 、嵌套圆填充的树可视化技术. Gou 等人综合集成了上述多种图可视化技术,提出了 TreeNetViz,综合了放射图、基于空间填充法的树可视化技术.这些图可视化方法技术的特点是直观表达了图节点之间的关系,但算法难以支撑大规模(如百万以上)图的可视化,并且只有当图的规模在界面像素总数规模范围以内时效果才较好(例如百万以内),因此面临大数据中的图,需要对这些方法进行改进,例如计算并行化、图聚簇简化可视化、多尺度交互等. 返回 大数据环境下数据可视化 大规模网络中,随着海量节点和边的数目不断增多,例如规模达到百万以上时,可视化界面中会出现节点和边大量聚集、 重叠和覆盖问题,使得分析者难以辨识可视化效果.图简化(graph simplification)方法是处理此类大规模图可视化的主要手段: ? 一类简化是对边进行聚集处理,例如基于边捆绑(edge bundling)的方法,使得复杂网络可视化效果 更为清晰,下图展示了 3 种基于边捆绑的大规模密集图可视化技术.此外,Ersoy 等人还提出了基于骨架的图可视化技术,主要方法是根据边的分布规律计算出骨架,然后再基于骨架对边进行捆绑; 返回 大数据环境下数据可视化 ? 另一类简化是通过层次聚类与多尺度交互,将大规模图转化为层次化树结构,并通过多尺度交互来对 不同层次的图进行可视化.例如,如图所示的 ASK-Graphview 能够对具有 1 600 万条边的图进行分 层可视化. 这些方法技术将为大数据时代大规模图可视化提供有力的支持,同时我们应该看到,交互技术的引入,也将 是解决大规模图可视化不可或缺的手段 返回 大数据环境下数据可视化 时空数据是指带有地理位置与时间标签的数据.传感器与移动终端的迅速普及,使得时空数据成为大数据时代典型的数据类型.时空数据可视化与地理制图学相结合,重点对时间与空间维度以及与之相关的信息对象属性建立可视化表征,对与时间和空间密切相关的模式及规律进行展示.大数据环境下时空数据的高维性、实时性等特点,也是时空数据可视化的重点. 返回 大数据环境下数据可视化 为了反映信息对象随时间进展与空间位置所发生的行为变化,通常通过信息对象的属性可视化来展现.流式地图 Flow map 是一种典型的方法,将时间事件流与地图进行融合,下图 显示了使用 Flow map 分别对 1864年法国红酒的出口情况以及拿破仑进攻俄罗斯的情况可视化的例子. 返回 大数据环境下数据可视化 散点图 (scatter plot) 是最为常用的多维可视化方法,二维散点图将多维中的两个维度属性值集合映射至两条轴,在二维轴确定的平面内通过图形标记的不同视觉元素来反映其他维度属性值,例如,可通过不同形状、颜色、尺寸等来代表连续或离散的属性值。 如下图所示.二维散点图能够展示的维度十分有限。 研究者将其扩展到三维空间,通过可旋转的 Scatter plot 方块(dice)扩展了可映射维度的数目,如下图中右图所示.散点图适合对有限数目的较为重要的维度进行可视化,通常不适于需要对所有维度同时进行展示的情况. 返回 大数据环境下数据可视化 投影(projection) 是能够同时展示多维的可视化方法之一.如左图所示,VaR 将各维度属性列集合通过投影函数映射到一个方块形图形标记中,并根据维度之间的关联度对各个小方块进行布局. 基于投影的多维可视化方法一方面反映了维度属性值的分布规律,同时也直观展示了多维度之间的语义关系. 平行坐标(parallel coordinates) 是研究和应用最为广泛的一种多维可视化技术,如右图 所示,将维度与坐 标轴建立映射,在多个平行轴之间以直线或曲线映射表示多维信息.近年来,研究者将平行坐标与散点图等其他可视化技术进行集成,提出了平行坐标散点图 PCP(parallel coordinate plots). 返回 问题与挑战 (1)多源、异构、非完整、非一致、非准确数据的集成与接口 大数据可视化所依赖的基础是数据,而大数据时代数据的来源众多。且对来自于异构环境,即使获得数据源,得到的数据的完整性、一致性、准确性都难以保证。数据质量的不确定问题将直接影响可视化分析的科学性和准确性,大数据可视化的前提是建立在集成的数据接口,并且与可视化分析系统形成松耦合的接口关系,以供各种可视化算法方便的调用,使得可视化分析系统的研发者和使用者不需
文档评论(0)