数据可视化真正可以遵循制图技巧.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据可视化 真正可以遵循的制图技巧 可视化有许多“规则”。有的是实际的规则 ,有的则是帮助你做出选 的建议。如果是出于数据的 要求 ,而且你也知道该怎么做 ,那么许多实际的规则也不必遵守。 但是 ,的确有一些规则不应该违背。这些规则通常是用于一些特定种类、几乎只能用特定方式阅读 的图表。当这些规则被打破 ,阅读过程中 ,数据有可能被误读。这会有点棘手。 条形图的基线必须从零开始 条形图依赖长度来呈现数据。短的条块代表较低的值 ,长一些的则表示较高的值。条形图的原理就 是通过比较条块的长度来比较值的大小。 当基线被改变了 ,视觉效果也就扭曲了。 举例来说 ,请看上图。左边第一幅条形图比较了两个值 :50和100 ,它有一条并且它有一条以零为 起点的基线。很好。代表数值100的条块长度正好是数值50的两倍长 ,为100正好也是50的两倍 大小。 但当你把基线变为一个更高的、非零的值时 ,第一个条形的长度变短了 ,而另外一个条形的长度却 没有变。此时值为100的条形不再是值为50的条形的两倍长。以此类推 ,当最后左边代表数值50的 条形彻底消失了 ,意味着100无限地大于50了。 条形图的基线必须从零开始。 例 :这张条形图是经福克斯新闻准许使用的。 3月31日目标的值为7,066,000 ,比6,000,000高17.8% ,然而第二个条形几乎是第一个条形长度的 三倍。 有人也许会反驳说 ,这张图的重点在于两个值的差而非这两个值本身。即便如此 ,用条形图来表示 本身就是一个错误的选 。使用时间序列来呈现月累积数也许会更好。 不要过分热衷于饼图 有些人认为 ,应该完全避免饼图。他们也许是对的 ,也许又不是。有些人也许会说 ,使用饼图完全 是一种不可原谅的错误。对此 ,我不同意。不管怎样 ,事实情况是人们仍然使用饼图 ,所以我们至 少可以争取正确地使用它们。 避免过度切割饼图 ,否则最终对它的阅读将难以为继。 那么多少是“太多” ?这是一个判断力的问题。不过 ,如果已经很难从图中看出其中一块扇形是另一 块两倍大 ,或者好几个较小的扇形区域看起来差不多大时 ,在扇形切割上面就该收手了。此时可以 考虑把较小的类目归入一个更大的 :“其他”。圆环图也是一样。 考虑把较小的类目归入一个更大的 :“其他”。圆环图也是一样。 同时也考虑一下用其他种类的图表来表示比例。 不要太依赖于饼图。 例 :这张饼图来自维基百科 ,它展示了国家的不同区域。 左边这张饼图中已经切割了许多块 ,但旁边另分离出一张饼图 ,显示了左图中看不清楚的更小国家 的情况 ,以此来提供更多的信息。有许多方式可以展示这组数据 ,比如树状图、按照数据比例制作 的图标 ,或者就用普通的地图。单薄的饼图只适用于显示只有几组值的数据。 尊重部分所占整体的比例 相较于呈现数值 ,有些图更着重于表现部分与整体的关系 ,它们表现的数据是部分所占整体比例。 比如 ,堆积式条形图 ,堆积区域图 ,树状图 ,马赛克图 ,圆环图以及饼图。在这些图表中 ,每一个 部分都表示一个独立的、不重叠的比例。 关于这一条 ,最常见的错误发生在调查问题允许多选时。比如说 :“你上周使用了哪一种交通工具 ? 可以多选。”这样的话 ,在人们多选的问题上就会出现比例的重叠 ,不同选项的百分比之和大于一。 为了避免这种情况 ,你不能直接把比例做成统计图。 例 :这张饼图来自福克斯新闻下属机构 ,它表现了三个不属于同一个整体的百分比。 每一个值都是一个单独的整体 ,因此在这一例中 ,用三个堆积式条块 (或普通的条块 )会更直观地 表现每个值的比例。 展示数据 让读者看到数据 ,这是可视化的重点。如果数据的呈现不够清晰 ,就违背了做图表的初衷。这常常 是因为一张图里的数据太多 ,于是读者的兴趣就被分散了。 这是一个经典的“绘图过度”的问题 ,相关的研究有很多。但是对于基本的图表 ,也有一些简单的解 决方式。 首先是可以改变符号的大小 ,这样上图中的小圆点 (或者是其他的符号 )就不会占据太多空间。为 了让数据直观清晰 ,主要要增加空白。 调节透明度 ,多层次的图案就不会被覆盖。 通过取样或者把对数据进行分类的方式 ,把总体分成几个更小的子群。从中 ,你可以采取小而多的 方式 ,这样每张表里的信息就会少一些。 数据进行再统计及分门别类。 总而言之 ,更好地呈现数据。 例 :这张图展示了金州勇士队在2008-09赛季的每个投篮。 这张图最终形成了一个球场的形状 ,并得出了对于球员们投篮最多的地点的一个小结论——近框 , 中距离 ,以及三分球。但是它们之间的差距是很小的 ,读者并不能看清真正量级上的差距

文档评论(0)

xina171127 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档