- 9
- 0
- 约5.95千字
- 约 5页
- 2023-11-09 发布于广东
- 举报
一种多数据融合的可视化方法
1 数据降维的应用
随着数据库的发展,数据的维象性在不同的领域得到了广泛应用。由于人类没有对高维数据的空间猜想能力,无法获得直观的认识,因此如何可视化多维数据,从中挖掘出有用的知识,是可视化面临的一个挑战。
多维可视化技术主要应用于数据挖掘领域中。目前,可视化技术运用于数据挖掘中通常是作为表达工具,如生成最初的视图,解析复杂结构的数据和显示分析结果等,目的是让用户直观地理解数据。
可视化领域涉及的范围较广,方法也比较多。传统的多维可视化方法有平行坐标系法、字形法(人脸、星型)、散点矩阵法、维入栈法等。当数据量较大、维数较多时,传统方法的可视化效果显得模糊。一种较好的解决办法是降维。降维是减少数据的维数,然后在减少的空间中可视化数据。可视化领域中有3种比较普遍的降维方法:主成份分析(PCA),自组织映射(SOM)及多维缩放(MDS)。目前,新的降维技术也被开发并被应用于可视化中,例如Random Mapping,Anchored Least Stress和Worlds within Worlds。Random Mapping采用随机转换矩阵实现高维数据到低维空间投影;Anchored Least Stress把PCA与MDS结合起来进行投影;Worlds within Worlds是保证多维信息中的一个或多个独立的变量为常量,每个常量与从多维信息中获取的无限薄的、和常变量轴垂直的切片相对应,从而降低多维信息的维数。
另外,不降维而直接进行投影的典型方法有Andrews曲线法和Star Coordinates等。Andrews曲线法将每一个多维数据通过一个周期函数映射到二维空间中的一条曲线上。这种方法能够表示的信息维数较多,但没有交互能力。Star Coordinates解决了交互性问题,该方法将星状坐标系的坐标轴投影到一个二维平面上,每个轴都共享原始点,每个点表示一个多维数据元素,数据的属性通过线性编码投影到二维平面上的相应位置。该方法直观,且具有交互性。然而,Star Coordinates中星状坐标系会造成空间重叠,导致点的歧义,这种重叠在多维空间投影到二维空间中是无法避免的。
本文针对Star Coordinates可视化方法的局限性,提出了一种旋转坐标系折线法,实现在旋转极坐标系下观察数据的分布,同时提出多角度交互连线法(Multiperspective Commutative Association,MCA),连接Star Coordinates与旋转坐标系折线法所形成的效果图,达到从不同的坐标系下观察、分析数据的目的,并通过Fisheye与星型法相结合加强可视化效果。
2 旋转坐标系法的取消线法
2.1 极坐标空间的扩展
旋转坐标系折线法是基于极坐标系定义而提出的。平面极坐标系由一个极点和一个极轴构成,极轴的方向为水平向右。平面上任何一点都可以由该点到极点连线的长度(极径)和连线与极轴的交角(极角)定义。球极坐标系与平面极坐标系比较相似,不同的是它用来表示三维空间的点。它在平面极坐标系基础上引出一个与平面的垂直极轴,空间中任意一点可以由极径、极角、极径与另一个垂直极轴的夹角来定义。平面极坐标系向球极坐标系的扩展可以看成将极径向垂直极轴旋转一个角度,同时改变其长度。通过平面极坐标系与球极坐标系的对比,可以看出极坐标蕴涵着极重要的“旋转思想”。N-1维极坐标空间扩展到N维极坐标空间上的一点可以简单地理解为由N-1维极坐标空间的一条极径旋转得到,旋转的方向是沿着一个与所有极轴正交的方向。可以看到N维极坐标空间下的点有唯一的极坐标值与之对应,可将这一限制略放宽松,使用户可以从低维空间的视觉角度下观察高维空间的数据。
2.2 .折线阶段的映射
旋转坐标系折线法的基本思想是将N维极坐标系映射到平面极坐标系中,使得各极轴不再正交而是同一方向——水平向右,但极点不唯一,它的位置由上一次极径旋转的终点来决定。这样每一条N维数据项映射为二维平面的一条折线,折线A0,A1,…,AN代表一条N维数据项,如图1所示。折线中每段线段的起点都是前一条线段的终点,其方向φi(与水平极轴的夹角)对应一条N维数据项的第i个维属性值,每条线段长度默认为相同,而最终的折线只保留终点作为数据项在平面上的映射,点P最终代表了一条N维数据项在二维平面上的映射。
旋转坐标系折线法通过将多个平面极坐标空间相互重叠把N维数据映射到二维平面上,并以散点图的方法进行可视化。但这并没有解决重叠空间造成的点的歧义问题,而且二维散点图对数据进行整体把握的同时缺少对数据细节的了解,为此,本文提出以下交互解决方案:
(1)改变极径长度:通过交互改变各个维属性所对应的极径的长度改变散点图,使用户加深对数据分布的理解。
(2)focus+context:通
您可能关注的文档
最近下载
- JVC摄像机GR-DX300AG用户手册.pdf
- 第1课 《邓稼先》:拳拳赤子心,璀璨星空梦(课件)-【大单元教学】七年级语文下册(统编版2024).pptx
- Netvault带库配置操作指引.docx VIP
- 《Netvault配置指南》课件.pptx VIP
- BRW500-31.5F型乳化液泵组随机图册教程.doc VIP
- NetVault Backup 简易操作指南.pdf VIP
- 曙光备份系统软件指南NetVault.pdf VIP
- 2024年青岛自招物理试题.docx VIP
- 2024年初中八年级下册名著《经典常谈》重点知识+内容概括+真题练习.pdf VIP
- 2025年八年级语文下册必读名著阅读《经典常谈》重点知识+内容概括+真题练习.docx VIP
原创力文档

文档评论(0)