资讯专栏INFORMATION COLUMN

关于“数据可视化思考者”的8条军规

wemall / 680人阅读

摘要:妙用色彩把色彩当作是数据可视化作品的促进因素,思考它们的强度,功能,还有背后的象征意义。数据观数据可视化思考者,以数据可视化为工具,对工作对企业对市场对世界进行思考。数据观,帮助您踏出成为数据可视化思考者的第一步。


文:数据观
经常在网络上看到这样的问题:“从零开始学习数据可视化,需要怎么开始?”《Data at Work》一书的作者Jorge Camoes在一次演讲中,提出了“数据可视化思考者”这一概念,并分享了他的12个想法。我们从中选取了最具价值的8个,进行了编译。
1、有数无形少直观,有形无数难入微

1973年,统计学家F.J. Anscombe提出了四组奇妙的数据。它们x值的平均数都是9.0,y值的平均数都是7.5;x值的方差都是10.0,y值的方差都是3.75;它们的相关度都是0.816,线性回归线都是y=3+0.5x。但是,经过可视化之后,人们发现这四组数据有着天壤之别。

第一组数据是最“正常”的;第二组数据所反映的是一个精确的二次函数关系,只是在错误地应用了线性模型后,各项统计数字与第一组数据恰好都相同;第三组数据描述的是一个精确的线性关系,只是这里面有一个异常值,它导致了上述各个统计数字,尤其是相关度值的偏差;第四组数据则是一个更极端的例子,其异常值导致了平均数、方差、相关度、线性回归线等所有统计数字全部发生偏差。
“有数无形少直观,有形无数难入微”。这个日后被称为“安斯科比四重奏”的例子告诉我们,在分析中,数据可视化与统计指标缺一不可,相辅相成。
2、“七三原则”

“数据可视化”这一表达,很容易让人觉得这是一个把70%的时间与精力花在“可视化”上的过程。但实际上,如果你真的用了大部分时间来保障图表炫酷,那么最后的成果只有30%的可能性是好的。真正的“数据可视化”,我们会把70%的时间花在减少错误、构建数据、确保概念正确等工作上。

(在线ETL功能,可以帮助您更顺利地完成那70%的“幕后”工作。)
3、可视化是门“杂学”

如今,从内部机制(如人脑认知系统)到外部机制(如社交规则,企业文化,同辈压力,受众画像等),都在影响着我们的可视化沟通方式。因此,有追求的数据可视化思考者应当追求成为“杂学家“,而不是局限于对可视化技巧与技能的学习。

俄国新闻机构TASS重新演绎了著名的《拿破仑远征图》。左边是随着故事线不断自动演绎变化的地图,右边是故事+信息图。像一本可以动的“小说”一样,利用叙事、色彩、动画等多种技巧,在可读性方面,完美致敬并超越了经典原作。

FRANCES CAALBREZZI对泰坦尼克号悲剧的数据可视化作品。她认为有千百种方法可以对数据进行可视化,但最终选择了冲积图。除了这种图表可以表现分类数据之间的流量与相关性之外,如水波暗涌一般的可视化效果,也更能让人回想起那一夜海上的惊心动魄。
4、数据是诠释

从你开始收集数据,到你阅读其它人的图表,这一切都是在诠释。你可以尽情地“折磨”数据,以压榨出各种各样的解释与观点。一个好的图表,会把数据想要说的话,尽善尽美地表达出来。也就是说,一个好的数据可视化作品,会是一个优秀的数据预处理系统,可以让人脑专注于更高层次的目标。但是光有数据可视化还不够:你必须拥有相关的知识,以识破和解读隐藏在可视化作品中的模式。

(优秀的可视化作品,可以让人拥有“数据视觉”,一眼看穿数据背后隐藏的模式、问题或机遇。将复杂的数据解读过程,变成简单的“比大小”、“看长短”、“辨深浅”、“明趋势”。)
5、数据可视化是一个提问与回答的过程

请注意自己所提的问题。它们通常不仅透露你想要知道的内容,还透露你实际知道的内容。更好的问题意味着更佳的理解。将问题分门别类,与各种图表类型配对,是个非常有趣的过程。一个有50个切片的饼图并不一定是坏的:通常,可视化失败并不是因为数据点太多,而是因为作者本身不理解数据,或是不关心数据传达出的信息。

(选择什么图表背后,隐藏着一个重要的问题——你想展示什么?)
6、注意简化

删除不相关的内容,最小化辅助的内容,调整必要的内容,添加有用的内容。
7、妙用色彩

把色彩当作是数据可视化作品的促进因素,思考它们的强度,功能,还有背后的象征意义。对于非专业设计师来说,可以先考虑数据可视化整体,再考虑配色。但请使用专业设计的配色模版,而不是默认的色板。
8、超越单图

尝试结构化或图表矩阵,多使用“看板”或“信息图”等表现形式,用图表与文字对数据进行连贯的叙述。在进行探索性分析的时候,“焦点+上下文”的表现形式,往往比“单图+过滤”更好。

(可实现“焦点+上下文”形式的看板。copyright@数据观)
数据可视化思考者,以数据可视化为工具,对工作、对企业、对市场、对世界进行思考。
数据观,帮助您踏出成为数据可视化思考者的第一步。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/8406.html

相关文章

  • 如何学好c语言

    摘要:第二条军规必须画图理解,内存布局语言是一门偏底层的语言,可以直接操作访问内存的所以我们应该清楚知道,写出的代码所对应的内存布局。如果想学好语言,三条军规势在必行最后,关于学好语言我想说的也就到这里了,感谢你的观看。 目录 一.讲这个主题的原因 二.关于选择问题 三.具体学习方法 一.为什么要...

    xingpingz 评论0 收藏0
  • Java异常处理12军规

    摘要:非检查异常是不需要在子句中声明的异常。在高执行级别,应记录此类异常。是最为严重的运行时错误,几乎是不可能恢复和处理,一些示例是,和。捕获异常时,也不要捕获范围太大,例如捕获,相反,只捕获你能处理的异常,应该处理的异常。 摘要: 简单实用的建议。 原文:Java异常处理12条军规 公众号:Spring源码解析 Fundebug经授权转载,版权归原作者所有。 在Java语言中,异常从...

    zeyu 评论0 收藏0
  • 赶集网mysql开发36军规

    摘要:写在前面的话总是在灾难发生后,才想起容灾的重要性总是在吃过亏后,才记得曾经有人提醒过。 写在前面的话:总是在灾难发生后,才想起容灾的重要性;总是在吃过亏后,才记得曾经有人提醒过。 (一)核心军规(1)不在数据库做运算:cpu计算务必移至业务层(2)控制单表数据量:单表记录控制在1000w(3)控制列数量:字段数控制在20以内(4)平衡范式与冗余:为提高效率牺牲范式设计,冗余数据(5)拒...

    U2FsdGVkX1x 评论0 收藏0
  • 20W字囊括上百个前端面试题项目开源了

    摘要:字囊括上百个前端面试题的项目开源了这个项目是什么项目内容这个项目目前在上刚刚开源主要内容如下前端面试题主要整理了高频且有一定难度的前端面试题对这些面试题进行解读前端原理详解针对一些有一定难度面试题涉及的知识点进行详解比如涉及的编译原理响应式 20W字囊括上百个前端面试题的项目开源了 这个项目是什么? 项目内容 这个项目目前在GitHub上刚刚开源,主要内容如下: 前端面试题: 主要整...

    Euphoria 评论0 收藏0
  • 从“雅虎军规”看性能优化

    摘要:避免重定向重定向用和状态码,下面是一个有状态码的头浏览器会自动跳转到域指明的。除此之外还有别的跳转方式元标签和,但如果你必须得做重定向,最好用标准的状态码,主要是为了让返回按钮能正常使用。要提高性能,优化这些响应至关重要。 showImg(https://segmentfault.com/img/bVbmMsz?w=652&h=367);一直以来,性能优化是开发的重中之中,而提及 前端...

    BlackMass 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<