资讯专栏INFORMATION COLUMN

数据分析报表系统的80/20法则

FleyX / 1738人阅读

摘要:在数据分析特别是商务智能中同样存在类似的情况。这里的现象就是人们发现的时间花费在报表系统的开发构建上,而真正使用报表的时间只有。这也是进几年流行的自服务数据报表系统。

80/20法则是计算机领域经常见到的现象,比如一个软件80%的时间只是在运行其中20%的代码,或者计算机芯片CPU只有20%的时间在做计算,其他80%的时间在休眠或者等待其他操作。

在数据分析特别是商务智能(BI - Business Intelligence)中同样存在类似的情况。在企业中,常常需要根据积累的数据来制定商业决策,最常用的方式是制作各种报表为企业管理人员提供决策支持。这里的80/20现象就是人们发现80%的时间花费在报表系统的开发构建上,而真正使用报表的时间只有20%。或者总的来说,80%的报表只有20%的人看。

通常的流程是:

管理层提出初步报表需求 -> 开发部门实现报表
-> 管理层提供反馈或者需要加入新数据 -> 开发部门完善报表
-> 管理层得到最终版本的报表进行商业决策

通常一个流程需要一至两个星期的时间,耗费的开发成本和时间成本比较高,有时候开发时间过长甚至会对商业上的决策造成拖延。

解决这个问题的办法就是打破80/20法则,甚至颠倒其中的比例,比如将开发报表的时间缩减至20%,进而让80%的时间花费在使用报表上。这也是进几年流行的自服务数据报表系统(Self-Service BI)。

要达到这个目标,有一些技术挑战:

方便易用的数据可视化工具

强大灵活的数据模型构建工具

集中管理的企业虚拟化数据仓库

解决以上技术挑战之后,整个企业的数据可以物理上存放在不同的地方,但是有一个统一的访问路径,开发人员定义好数据模型之后,企业管理人员或者非技术人员可以使用傻瓜式的数据可视化工具,自己选取想要查看的数据,进行数据分析。新的报表流程简化为:

管理层提出报表数据需求 -> 开发部门建立数据模型 -> 管理层自己查看数据

完成这个改造后的流程之后,当有新的报表需求,开发人员所需要的工作仅是创建和维护数据模型,从企业角度,报表开发时间降低到20%,而80%的时间是用户在使用报表系统。

由于篇幅所限,这里就不展开对这些技术的具体阐述了。有兴趣者可以联系作者进一步交流(boyang798@gmail.com)。

现在国内有些公司已经开始在这个领域做了扎实的基础工作,比如数据可视化工具已经比较成熟,数据仓库也有公司在做底层数据平台,在数据模型构建工具方面,目前还不是很成熟,希望未来有更多的公司进入这个领域,提供成熟的解决方案。


扫描微信二维码联系作者

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/8159.html

相关文章

  • PHP 开发中外围资源性能分析(二)

    摘要:本文作为针对外围资源性的能分析,比较简单地设计了一些实验场景,看到了外部资源,包括中间件和数据库资源给程序性能带来的影响。有关影响程序性能的后端外围资源就到这里,在下一篇中,我们将分析前端或者前后端结合给页面延时带来的影响。 暂且不讨论「PHP 是不是最好的编程语言」,本文我们将分别分析一下在 PHP 程序的后端外围资源和前端外围资源,它们对整个 PHP Web 应用体验的影响,这往往...

    cod7ce 评论0 收藏0
  • 被Geoffrey Hinton抛弃,反向传播为何饱受质疑?

    摘要:在最近的一次人工智能会议上,表示自己对于反向传播非常怀疑,并提出应该抛弃它并重新开始。在人工智能多年的发展过程中,反向传播已经成为了深度学习不可或缺的一部分。最后,我们会将这些规则组合成可用于任意神经网络的反向传播算法。 现在的深度学习发展似乎已经陷入了大型化、深度化的怪圈,我们设计的模型容易被对抗样本欺骗,同时又需要大量的训练数据——在无监督学习上我们取得的突破还很少。作为反向传播这一深度...

    yvonne 评论0 收藏0
  • 漫谈开发设计中一些“原则”及“设计哲学”

    摘要:在开发设计中有一些常用原则或者潜规则,根据笔者的经验,这里稍微总结一下最最常用的,以飨读者。是处理复杂性的一个原则。参考六大设计原则里氏替换原则奥卡姆剃刀如有问题可以通过邮件微信联系我。 在开发设计中有一些常用原则或者潜规则,根据笔者的经验,这里稍微总结一下最最常用的,以飨读者。 DRY 这里的DRY是Do Not Repeat Yourself的缩写。具体解释参见 ,严谨的定义是 E...

    william 评论0 收藏0
  • 从图像到知识:深度神经网络实现图像理解原理解析

    摘要:本文将详细解析深度神经网络识别图形图像的基本原理。卷积神经网络与图像理解卷积神经网络通常被用来张量形式的输入,例如一张彩色图象对应三个二维矩阵,分别表示在三个颜色通道的像素强度。 本文将详细解析深度神经网络识别图形图像的基本原理。针对卷积神经网络,本文将详细探讨网络 中每一层在图像识别中的原理和作用,例如卷积层(convolutional layer),采样层(pooling layer),...

    UnixAgain 评论0 收藏0
  • 有了 TensorFlow.js,浏览器中就能进行实时人体姿势判断

    摘要:反馈检测到的每个人的置信度值以及检测到的每个姿势关键点。姿势置信度这决定了姿势判断的整体置信度。在较高级别,这将控制回馈的姿势较低置信度分数。只有在调整姿势置信度得分不够好的情况下,为了过滤掉不太准确的姿势,该数值应该增加或减少。 文 / Dan Oved,Google Creative Lab 的自由创意技术专家,纽约大学 ITP 的研究生。编辑和插图 / 创意技术专家 Irene Alv...

    KaltZK 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<