数据可视化专业技术分析(成品).pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据可视化专业技术分析(成品)

;目录 ;01;;;数据可视化发展历程;;一幅图胜过千言万语.人类从外界获得的信息约有 80%以上来自于视觉系统,当大数据以直观的可视化的图形形式展示在分析者面前时,分析者往往能够一眼洞悉数据背后隐藏的信息并转化知识以及智慧 如图 所示是互联网星际图,将 196 个国家的 35 万个网站数据整合起来,并根据 200 多万个网站链接将这些星球通过关系链联系起来,每一个星球的大小根据其网站流量来决定,而星球之间的距离远近则根据链接出现的频率、强度和用户跳转时创建的链接. 我们可以立即看出,Facebook 以及 Google 是流量最大的的网站。;02;空间三维图形;Scatter plot 是显示多个数据维中任意两个数据维之间的 依赖关系的矩阵图,分别把多维数据中的每一个维数对称地 标注在横轴和纵轴上,把它们在数据集中每一对出现的频度 作为关系依赖的评价,这样每两维的关系被显示在这个平面 网格图中(图 3)。在 Scatter plot 的 matrix n 维矩阵中, scatterplots 会产生 n*(n-1)/2 对维之间的关系。; 1.星型图:每个星型标记的构造方法如下:任选空间的某一点作为一个 星型标记的中心点,由中心点作出 n 条线段来代表 n 个数据维,这 n 个线段把平面平均分成 n 份。一般地,每一个线段长度代表一个数据维的值的大小。把一个星型标记线段的终点全部用直线连接起来,就构成了一个星型图(图 4)。每一个星型图都代表数据库中一条记录,这样一组数据就用一组星型来代表。 2.雷达图:类似于星型图的构造方法。 3.Andrew’s Gurves:对于多维数据的数据点 x=(x1,x2,*,*,*,*,xn),被周期函数 Fx(t)= X1/sqrt(2)+ X2sin(t)+ X3cot+ X4Sin(2t)+cos(2t)作用于一个多维数据点或者(一个多维)数据集合,被显示成为一组曲线,曲线的分布情况反映了数据的性质。 4.shapecoding 技术:主要思想是每一个数据点位于一个已经分解成 n 个细胞表格的长方形中,而且每一个细胞表格的颜色由每一维来控制。 5.Grand-tour 技术:从不同的视角看待多维数据,投影数据在可能的 d-planes 通过泛化的旋转。 ;平行坐标技术是最早提出的以二维形式表示 n 维空间的数据可视化技术之一。它的基本思想是将 n 维数据空间用n 条等距???的平行轴映射到二维平面上,每条轴线都对应于一个属性维。坐标轴的取值范围,从对应数据维属性的最小值到最大值均匀分布(名词性属性依次在数据维上标出即可),这样数据库中的每一条数据记录都可以转换成为图形的形式,都可以用一条折线表示在 n 条平行轴上;03;数据挖掘的可视化;;;04;公司财务报表、销售统计 经济趋向、股票趋势 数据挖掘 电子地图 核磁共振、CT扫描 地质勘探、油气勘探 天气预报 人口普查等等; 大数据可视化分析是指大数据自动分析挖掘方法的同时,利用支持信息可视化的用户界面以及支持分析过程的人机交互方式与技术,有效融合计算机的计算能力和人的认知能力,以获得对于大规模复杂数据集的洞察力。;大数据可视化分析;上图是经典的信息可视化参考模型 大数据分析将掘取信息和洞悉知识作为目标,根据信息的特征把信息可视化技术分为一维信息、二维信息、三维信息、多维信息、层次信息、网络信息、时序信息可视化。 随着大数据的兴起于发展,互联网、社交网络、地理信息系统、企业商业智能、社会公共服务等主流应用领域逐渐催生了几类特征鲜明的信息类型,包括文本、网络或图、时空、多维数据等,这些与大数据密切相关的信息类型???将成为大数据可视化的主要研究领域。;大数据可视化分析方法;;Twitter热词的Wordle;统计图表;;05;基本工具(拖拽式) 进阶工具(编程式);Moojnn实例;GeoFlow实例 ; OpenStreetMap;Google Chart API工具集中取消了静态图片功能,目前只提供动态图表工具。能够在所有支持SVG\Canvas和VML的浏览器中使用,但是Google Chart的一个大问题是:图表在客户端生成,这意味着那些不支持JavaScript的设备将无法使用, 此外也无法离线使用或者将结果另存其他格式,之前的静态图片就不存在这个问题。尽管存在上述问题,不可否认的是Google Chart API的功能异常丰富,如果没有特别的定制化需要,或者对Google视觉风格的抵触,那么你大可以从Google Chart开始。;作为用来分析大数据集的统计组件包,R是一个非常复杂的工具,需要较长的学习实践,学习曲线也是本文所介绍工具中最陡峭的。但是R拥有

文档评论(0)

盼储储time + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档