- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据导论
第十五章
CONTENTS
目录
PART 01 数据可视化简介
PART 02 数据到视觉通道的映射
PART 03 基本图表
PART 04 大数据可视化简介
PART 05 高维数据可视化
PART 06 作业
PART 01 数据可视化简介
什么是可视化
什么是数据可视化
数据可视化是关于数据的视觉表现形式的研究;这种数据的视觉表现形式被定义为一种以某种概要形式抽提出来的信息,包括相应信息单位的各种属性和变量。
数据可视化的标准
数据可视化的标准
可视化技术应用标准应该包含以下5个方面:
1) 真实性:可视化结果应该正确反映数据的本质;
2) 直观化:将数据直观、形象的呈现出来,有利于人们认知数据背后所蕴涵的现象和规律;
3) 关联化:突出的呈现出数据之间的关联性;
4) 艺术性:使数据的呈现更具有艺术性,更加符合审美规则,使可视化结果的形式与内容和谐统一;
5) 交互性:实现用户与数据的交互,方便用户控制数据。
数据可视化的发展阶段
数据可视化的发展阶段
1. 科学可视化
科学可视化主要关注三维空间数据的可视化,强调线、面、体等几何、拓扑结构的真实表达。其主要应用领域是自然科学。
根据数据的不同类别,科学可视化可分为三种:
标量场可视化
矢量场可视化
张量场可视化
数据可视化的发展阶段
数据可视化的发展阶段
2. 信息可视化
二十世纪90年代初期,人们发起了一个称为“信息可视化”的研究领域,旨在为许多应用领域之中对于抽象的异质性数据集的分析工作提供支持。信息可视化是以增强人的认知能力为目的的抽象数据和非结构化数据可视表达的研究。
与科学可视化相比,信息可视化主要关注抽象数据,不仅包括数值数据,也包括非数值数据,如文本、图像、层次结构等。
数据可视化的发展阶段
数据可视化的发展阶段
3. 数据可视化
信息可视化更关注数据,包括那些来自商业、财务、行政管理、数字媒体等方面的大型异质性数据集合。因此,21世纪人们正在逐渐接受这个同时涵盖科学可视化与信息可视化领域的新生术语“数据可视化” 。
数据可视化指的是技术上较为高级的技术方法,而这些技术方法允许利用图形、图像处理、计算机视觉以及用户界面,通过表达、建模以及对立体、表面、属性以及动画的显示,对数据加以可视化解释。
数据可视化流程
数据可视化流程
数据可视化流程中的核心要素包括如下三个方面:
数据表示与变换
数据可视化的基础是数据表示和变换。
输入数据须从原始状态变换到一种便于计算机处理的结构化的数据表示形式。
通常这些结构存在于数据本身,需要研究有效的数据提炼或简化方法以最大程度地保持信息、知识的内涵和相应的上下文。
数据可视化流程
数据的可视化呈现
数据可视化向用户传播了信息,而同一个数据集可对应多种视觉呈现形式,即视觉编码。
数据可视化的核心内容是从巨大的呈现多样性空间中选择最合适的编码形式。
判断某个视觉编码是否合适的因素包括感知与认知系统的特性、数据本身的属性和目标任务。
数据可视化流程
用户交互
对数据进行可视化和分析的目的是解决目标任务。通用的目标任务可分成三类:
生成假设
验证假设
视觉呈现
交互是通过可视的手段辅助分析决策的工具。
数据可视化流程
1990年Robert B. Haber和 David A. McNabb提出的数据可视化流程,它展示了以数据模态为依据的可视化流程:分析、滤波、可视映射和绘制。
数据可视化流程
从数据变换的角度看,可视化流程也可理解为四个数据阶段和三种数据转换操作:
PART 02 数据到视觉通道的映射
基本数据类型
数据集由数据对象组成,一个数据对象代表一个实体。
数据对象又称样本、实例、数据点或对象。
属性是一个数据字段,表示数据对象的一个特征。
特征、属性、维变量可以互换地使用。
一个属性的类型由该属性可能具有的值的集合决定。
属性可以是:
类别型的
有序型的
数值型的
基本数据类型
类别型数据
类别型数据的值是一些符号或事物的名称。
假设:
头发颜色和婚姻状况是两个描述人的属性。
头发颜色的可能值为黑色、棕色、淡黄色、红色、赤褐色、灰色和白色。婚姻状况的取值可以是单身、已婚、离异和丧偶。
它们都是类别型数据。
基本数据类型
有序型数据
有序型数据是一种属性,其可能的值之间具有有意义的序,但是相继值之间的差是未知的。
学习成绩是一个有序型数据,例如A+、A、A-、B+等。
职位也是一个有序型数据,例如对于教师有助教、讲师、副教授和教授等。
这些值具有有意义的先后次序,然而,我们不能说教授比讲师大多少。
基本数据类型
数值型数据
数值型数据是定量的,即它是可度量的量,用整数或实数值表示。数值属性可以是区间标度的或比率标度的。
区间标度数据用相等的单位尺度度量。
文档评论(0)