基于树图的大规模数据集合.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于树图的大规模数据集合 0 可视化树图的应用 1991年5月,美国密歇根大学的虚拟机专家贝塞尔姆提出了一种新方法来表示大数据集。这种方法采用基于二维空间填充的技术将显示空间划分为许多具有一定大小的矩形来可视化层次数据集合, 充分利用了显示空间的每一个象素。由于树图可用各个矩形的大小来表示数据元素的某一属性, 非常适合数据集合很大的情况。 树图现在已经应用在很多领域的可视化中。1992年, 德国的Alexander Jungmeiseter使用树图可视化了一个销售公司的管理结构, 这个应用程序可以显示客户、管理人员、工业部门和市场的层次结构。2001年, 微软研究小组的Marc Smith将树图使用在Netscan项目中用于可视化Usenet, 网上最大的虚拟社会之一;微软公司还在它的.NET开发环境中加入了树图组件。2003年, IBM公司也开始使用树图来可视化它的网络管理系统。 目前针对树图的研究主要集中在国外, 国内几乎没有涉及树图的研究。研究树图主要集中在如何直观地显示层次结构和优化矩形长宽比这两个方面, 由于研究起步晚, 方法还不够全面, 因此树图有进一步改进的潜力和可能。 1 树图的应用研究 对于一个具有层次结构的数据集合, 图1显示了用传统的节点连接图和树图来可视化同一个层次数据集合的结果。 树图的生成过程如下:整个显示空间, 即初始矩形, 被用来表示整个数据集合 (等同于节点-连接图中的根结点A16) 。然后, 根据下一层的数据元素B3、C3和D10的大小, 纵切初始矩形, 切出的三个矩形分别对应B3、C3和D10, 并且它们的面积比例和它们对应数据元素的大小比例相同。然后如此递归, 每次递归都改变切割的纵横方向, 一直切到叶子节点为止。这也就是最简单的Slice-and-Dice算法。 在数据规模比较大的时候, 树图更能体现它相比传统方法的优越性。图2显示了一个磁盘上文件系统的总体情况。这个文件系统上一共有1400多个文件, 而用树图可以毫不费力的将他们显示出来, 这是任何传统可视化方法都无法做到的。用户还可以直观的从整张图上看出哪个文件最大, 消耗了磁盘的空间等等。通过点击方块可以获得对应文件的详细信息。 虽然树图在可视化大规模层次数据集合方面有节省空间的优势, 但从图2中我们也不难看出, 树图存在前文中提到的两个明显的缺陷:层次结构不够直观和生成矩形长宽比过大。因此针对树图的理论研究主要集中在改进树图的两个缺陷上。近十年来, 可视化的研究者们提出了多种树图生成算法, 其中有改进树图层次结构显示的Cushion算法, 改进树图矩形长宽比的正方化算法, 以及针对正方化算法乱序的缺陷提出的Pivot算法和Strip算法。下面介绍和比较这几种树图生成算法。 1.1 cup实现树图的层次结构 从图2中可以很直观地看到一个磁盘上文件大小的总体信息。然而, 磁盘上的文件是个典型的树型结构, 每一层的文件就像叶子结点, 而文件夹像中间接点。从这个树图上虽然可以清楚的看出叶子结点大小比例关系, 但是其中a文件和b文件是同一目录下的吗?c文件是不是d文件上层目录的?这些层次信息在树图中体现的很不明显, 不符合可视化的原则。 Eindhoven大学的Jarke J.van Wijk提出了一种用阴影来表示层次关系的树图生成算法。这种算法使用不同的阴影来表示整个树图不同的层次, 使得层次结构非常直观。图3是一个使用阴影单方向分割的例子。 图3中, 下方是显示空间, 现预将它切割成表示三层、每层两个元素 (假设大小相等) 的树图。第一层有两个元素, 将宽等分成两个子宽, 并在其上都添加一个突起。对每个子宽又划分两个子宽, 并添加两个幅度为上一步一半的突起。如此划分并添加, 直到最底层元素。图中下半部分既是使用这种算法产生的树图。如果我们从切面观察树图, 这些突起就构成了一系列的脊, 这些脊清楚的将不同元素分开。而且, 两个脊中间峡谷的深度越深, 说明两个脊层次越高。 图4给出了一个较复杂的层次数据集合用Cushion算法生成的树图的例子。可以看出图的层次结构信息很明显, 而且也不需要牺牲额外的显示空间来表示层次结构。 Cushion算法本身并不是一种生成树图的算法, 不提供切割矩形的方法和策略, 它所做的就是在矩形切割好以后, 按照矩形的大小和切割的方向在其上添加阴影, 模拟突起的效果。因此, Cushion算法可以灵活的和其他算法结合使用。但是, Cushion算法也有其不足之处。树图的设计方案决定了树图只能通过矩形的面积和矩形的颜色两个要素, 同时表示出至多二维的信息。嵌套树图不得不牺牲一部分矩形的面积作为边缘来体现层次关系 (改变矩形边缘宽度事实上也是牺牲一部分矩形的面积换取一定层次关系的体现) 。Cushion算法自然也不

文档评论(0)

xlwkyc + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档