资讯专栏INFORMATION COLUMN

精读《Tableau 入门》

svtter / 1215人阅读

摘要:可以看到,遥遥领先的城市有三个,加州是销售之王。将再拖拽到,并右键将其粒度改为月。从上图可以看到,指定了个分类,最右上角加州就是最突出的一组,整个聚类只有它一个元素,而画面偏左下角的也是一类,这些是业绩较差的一组数据。

1. 引言

引用著名瑞典统计学家 Hans Rosling 的一句话:想法来源于数字、信息,再到理解。

分析数据的最好方式是可视化,因为可视化承载的信息密度更高,甚至可以从不同维护对数据进行交互式分析。今天要精读的文章就分析了经典可视化分析工具 Tableau:data-visualisation-made-easy。

2. 精读

Tableau 是一款广泛用于智能商业的强大数据分析工具,通过不同可交互的图表和仪表盘帮助你获得业务洞见。

安装

Tableau 提供了三种使用方式:

Tableau Desktop

拥有 14 天免费试用的桌面版,可以将工作数据存储在计算机本地,如果你是学生或老师可以获得一年的免费使用权。

Tableau Public

公开版完全免费,和桌面版的唯一区别是,所有数据都无法保存在本地,只能保存在 Tableau 服务器的云端,而且是公开的。

Tableau Online

网页版也完全免费,是 Tableau Public 的网页版。

连接数据源

安装好 Tableau 后,第一步就是连接数据源。它支持连接本地或云端的数据源,本地最常用的数据源可以从 Excel 转换。这里是一份 样例数据,包含了一个超市几年内的销售情况,我们可以用这份数据练手。

下载好这份数据后,选择从 Excel 导入,确认后将 Orders 表拖拽到右侧区域,如下图所示:

可以看到表结构已经正常了,在数据清洗的过程中,Tableau 强大的数据分析功能已经初见端倪。你甚至可以点击 Review ths results 看看它是如何清洗数据的:点击后会下载一份分析 Excel,其中过滤掉的数据会被标记,自动分析出的表结构会被高亮。

数据可视化

在页面最底部有几个切换项,依次是 Data Source:数据源、Sheet:工作簿,后面跟随的三个按钮可以继续创建多个 Sheet、Dashboard、Story,这些后面都会讲到。首先点击 Sheet 进入可视化分析的工作簿:

可以看到,总利润大概是总销量的 10%。如果想展示横向表格,将 Measure Names 从 Rows 拖拽到 Columns 即可。

Tips: 为了方便区分,Tableau 贴心的将维度标记为蓝色,度量标记为绿色。
同时可以看到,Tableau 对于单指标拖拽,默认采取表格方式渲染。

接下来我们要看每一年的详细销量与利润:

将 Order Date 与 Sales 拖拽到 Rows。

右键 Sales,将类型从连续改成非连续,这样就会自动变成表格展示。

为了展示利润,将 Profit 字段拖拽到 Marks 的 Text 字段上。

我们可以看到,销量较高的月份分布在:3、9、11、12 月。注意由于没有对年份做筛选,这里的每月统计数据是整合了 2013~2016 四年份的。也就是 1 月的数据其实代表了 2013.1 + 2014.1 + 2015.1 + 2016.1 共四个 1 月份数据的总和。

接下来我们想了解销量与利润增长的趋势:

将 Order Date 拖拽到 Columns。

将 Sales 拖拽到 Rows,此时会出现一条线。接下来将 Profit 拖拽到 左 Y 轴

上图可以明显看到三个峰值出现在 3、9、11 月份,然而这段期间利润增长幅度却不大,可以看出这段期间采取了薄利多销的手段。

再从地区维度分析数据:

将 Regions 和 Sales 拖拽到 Columns。

切换到饼图。

将 Sales 拖拽到 Marks Pane 的 Label 上。

可以看到数值越大的区域一般颜色也越深,但这不是分析利润/销量性价比的最佳方式,我们先只看到加州和纽约是销售业绩最好的区域,而科罗拉多州虽然销量不错,但利润却是负的。

上面的地图对地形比较直观,但要分析销售健康度,还是用散点图更合适。我们想看看城市销量/利润的健康度分布:

Profit 拖拽到 Columns,Sales 拖拽到 Rows,此时散点图出现,但只有一个点(之所以出现散点图,是因为横纵轴拖拽的都是度量)。

我们想按城市下钻,只要把 State 拖拽到 Detail 即可。

可以看到,办公套件和科技产品业绩最好,其中办公套件在 2015 年 12 月销量利润双丰收,科技产品在 2015 年 10 月与 2016 年 3 月销量利润双丰收。整体来看前半年是淡季。

但这张图无法看到销量与利润性价比关系,我们要找出利润率最高的商品和利润率最低的商品:

将 Proft 拖拽到 Columns。

将 Sub-Category 拖拽到 Rows。

切换到 Horizontal Bars。

将销量 Sales 拖拽到 Color。

Tablueau 这种交互等价于 Sql 中 in 语句,当然 Tablueau 还支持更复杂的条件或代码表达式,这里只是将更友好的筛选方式优先展示区来。

上卷下钻

Tableau 支持任意维度之间的上卷下钻,只要你将他们分好组。

比如将 Order Date、Order ID、Ship Date、Ship Mode 拖拽到一起,成为 Orders 组;将 Category、Sub-Category、Product ID Product Name 形成 Product 组:

上卷下钻是顺序相关的,比如 Product - Order Date 表示在产品类目基础上,对每个类目按日期下钻。而 Order Date - Product 这个顺序,表示在日期分布的基础上,对日期按产品类目下钻,了解不同日期下每个产品的分布情况。

趋势线

为使用趋势线,先制作一个双轴图:

将 Sales 与 Profit 拖拽到 Rows。

将 Order Date 拖拽到 Columns 并切换到月维度。

选择 Show Me 的 Dual Combination 即混合图。

趋势图有几种算法,比如线性,Log 或指数,因此在做趋势分析前,首先要判断自己的业务属于哪种增长阶段,如果是爆发期可以选择指数,平稳期可以选择线性等等。

预测

回到按月分布的图表,如果我们想预测未来销量和利润的走势,可以使用预测功能:

切换到 Analytics Tab,并将 Forecast 拖拽到图表中。

可以点击右键配置预测参数。

从上图可以看到,指定了 4 个分类,最右上角加州就是最突出的一组,整个聚类只有它一个元素,而画面偏左下角的也是一类,这些是业绩较差的一组数据。使用了 K 均值聚类算法,并且当你点击右键查看详细星系时,还能把组间、组内方差展示出来:

Tableau 的所有图表都支持点选,排除等操作,那么点选这类操作本质上其实是个筛选的过程,比如柱状图点击了某根柱子,可以认为是选择了这根柱子当前的维度值作为筛选条件。

当一个 Sheet 作为筛选条件后,类似点选这种操作产生的筛选就会作用于其他同数据集的图表,因此如上图所示,当点击了条形图的某一根柱子时,上面的销量地图也自动做了筛选,仅展示当前选中的产品的销量分布。

故事

Story 更像是 PPT,将分析后有价值或有意义的图表组合在一起,再配合上说明,得出一些结论:

版权声明:自由转载-非商用-非衍生-保持署名(创意共享 3.0 许可证)

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/106665.html

相关文章

  • 精读Tableau 探索式模型》

    摘要:比如我们对调与会怎样我们得到了三个不同类目近个月的趋势,之所以是折线图,因为图表的维度轴列是连续的。在正式介绍标记区域前,先理解一下为何会发生这种转变表格类组件是双维度组件,折线图是单维度组件。 1. 引言 Tableau 探索式分析功能非常强大,各种功能组合似乎有着无限的可能性。 今天笔者会分析这种探索式模型解题思路,一起看看这种探索式分析功能是如何做到的。 2. 精读 要掌握探索式...

    curried 评论0 收藏0
  • 精读《前端未来展望》

    摘要:精读前端可以从多个角度理解,比如规范框架语言社区场景以及整条研发链路。同是前端未来展望,不同的文章侧重的格局不同,两个标题相同的文章内容可能大相径庭。作为使用者,现在和未来的主流可能都是微软系,毕竟微软在操作系统方面人才储备和经验积累很多。 1. 引言 前端展望的文章越来越不好写了,随着前端发展的深入,需要拥有非常宽广的视野与格局才能看清前端的未来。 笔者根据自身经验,结合下面几篇文章...

    MadPecker 评论0 收藏0
  • 精读《正则 ES2018》

    摘要:虽然正则中可以匹配任何字符,但却无法匹配换行符。精读文中列举的四个新特性是加入到正则中的。讨论地址是精读正则如果你想参与讨论,请点击这里,每周都有新的主题,周末或周一发布。 1. 引言 本周精读的文章是 regexp-features-regular-expressions。 这篇文章介绍了 ES2018 正则支持的几个重要特性: Lookbehind assertions - 后行...

    JellyBool 评论0 收藏0
  • 精读《谈谈 Web Workers》

    摘要:可以将耗时任务拆解出去,降低主线程的压力,避免主线程无响应。主线程接收发消息每个实例通过接收消息,通过发送消息。收发主线程消息和主线程代码类似,在代码中,也是接收消息,这个消息来自主线程或者其它。 1 引言 本周精读的文章是 speedy-introduction-to-web-workers,是一篇 Web Workers 快速入门的文章,借精读这篇文章的机会,谈谈对 Web Wor...

    myeveryheart 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<