{eval=Array;=+count(Array);}

问答专栏Q & A COLUMN

大数据分析需要学习什么?

linkinlinkin 回答0 收藏1
收藏问题

10条回答

go4it

go4it

回答于2022-06-28 14:17

这个我有经验,我来答一下????‍♂️

目前在我们数据行业内的日常用语中,数据分析和数据可视化这两个术语似乎已成为同义词。虽然说两者它都包含数据分析的内容,但实际上还是有一定的细微差别。就比如说

数据分析:它更多的强调的是一个逻辑思维能力,强调的是一个探索性的过程,通常从特定的问题开始。它需要好奇心、寻找答案的欲望和很好的韧性,因为这些答案并不总是容易得到的。

而数据可视化分析:它就在数据分析的基础上涉及到数据的可视化展示,从单个图表到全面的仪表盘。借助有效的可视化显著减少了受众处理信息和获取有价值见解所需的时间。加快了数据分析的效率,但是不是什么样的可视化都能达到我们的目的,还需要具备很多必要的条件。

简单来说:

数据分析其实就是通过你的逻辑思维能力在一张普通的白纸上把一道数学题解答了出来,而数据可视化分析在于你不但把这道题解答了出来,还通过一些可视化工具把这个答案呈现的比较好看以及让局外人更容易理解~

虽然两者存在着天然的差别。但这并不是说两者永远不会和谐共处或者离和谐很远。其实在实际处理数据时,分析应该先于可视化输出,而可视化分析可能是呈现有效分析结果的一种好方法,两者在应用中存在着关联。

所以在这里我个人能够提供给题主的意见是:

想入行数据分析师这个方向,必须学习数据可视化技能!多一项把数据分析用可视化工具展现出来的技能不好吗?反正都是分析师,技多不压身哦~竞争力会大一些,而且还是现如今这种追求美的社会背景下~好看的图表呈现的数据,还是要比一堆枯燥的数字,文字要吸引人的多!!!!!

那么要入行数据可视化分析,你要会什么技能?

对于数据可视化分析师来说,他应该是多才多艺的,具有良好的数据收集和分析复杂数据的能力是必备条件,无论是叙述还是统计。具体的话应该掌握以下几点:

  1. 强大的分析能力
  2. 良好的沟通及人际交往能力,才能建立良好的工作关系
  3. 要具备在技术/非技术人员面前解释事物的能力
  4. 有能力自主工作,也可在团队工作
  5. 具备时间管理技能
  6. 项目管理技能,与利益相关者进行规划、组织和协调项目的方方面面
  7. 有能力处理压力和解决问题的能力
  8. 积极自我激励,快速学习和创新的人
  9. 掌握一些列数据可视化分析工具「重点掌握」

除了基本的数据分析能力,你还要会什么技能?

如果要选择数据可视化分析方向,你一定要了解可以借助哪些工具来展示你的数据分析结果????

那么对于数据可视化分析来说,相关软件那么多,你如何选取最适合的工具才能做出最好的呈现效果,????下面????

1. 专业图表类(Excel、BI图表、PPT等)

适用人群:面向有数据可视化需求的对象

使用难度:中等

特点:需要有一定的基础,比较专业,适合有针对性的图表制作

2. 开发工具类(Python、R语言等)

适用人群:多为开发人员使用,技术方面有一定要求

使用难度:较高

特点:专业化可视化工具,会涉及到系统的编程开发,因为涉及到二次开发,所以个性化的程度比较高

3. Saas版本在线工具(袋鼠云EasyV、ucloud云DataV、ucloudRaydata等)

适用人群:面向业务人员

使用难度:简单

特点:属于零编程类,操作简单,多面向业务人员,基于数据分析的一款可视化工具

如何选择最合适的数据可视化工具?

如果入职大型企业的数据可视化分析师后,你如果要进行数据分析,那肯定讲究的就是一个数据的时效性,所以数据可视化大屏分析工具的选用也是作为数据分析者也是必须掌握的一个技能之一。

所以在工具的选择上,其实个人还是推荐大家使用saas版的在线工具类,学习难度小,花费的时间成本低,就比如拿袋鼠云的数据可视化EasyV这个工具来说「以下纯属个人的免费试用体验」:

免费试用链接也可以分享给大家????,可以自己体验看看效果如何:免费试用撮这里????️????https://easyv.dtstack.com/jiuqi

EasyV它是一款数据可视化应用平台,使用者可以通过EasyV来更高效的实现数据可视化场景,而且它产品内有丰富的模版可以满足85%的真实的可视化场景需求,包括还有一些海量的自定义组件,样式精美,通过简单的“拖拉拽”动作即可根据自己需求来替换模板的单个组件。除此之外还有很炫酷的3D地图还原了真实的世界,这个EasyV产品还涉及了动态面板以及交互功能,让静态的大屏可以根据自己的创意灵动起来。我们可以自己设置手机终端远程操作大屏,让汇报、讲解变得十分轻松。

从袋鼠云官网扒下来的官方介绍:????

EasyV - 袋鼠云 easyv.dtstack.com/jiuqi

EasyV产品优势:EasyV内置丰富的场景模板,用户可依据模板进行项目交付、用户限制宽松、EasyV性价比更高

产品特点:纯界面化操作、丰富的组件模板、多形态交互、多数据源支持、轻量易部署、自定义组件开发

当然国内还有很多其他优秀的数据可视化工具????,我之前都一一试用体验过也写过一篇总结性的文章,大家有兴趣的话也可以去看看????

2020年最好用的十大数据可视化平台,你值得拥有

最后想给大家分享一句话

要想入行某一个行业,必须要学会行业的专业基本技能,这样你才有自己的核心竞争力,在职场上所向披靡。

「欲善其工 必先利其器」

更多数据可视化相关知识,大家关注我呀关注我关注我就有很多免费知识可以学习啦!!


评论0 赞同0
  •  加载中...
Anonymous1

Anonymous1

回答于2022-06-28 14:17

忍不住要发言了,不要一直以一个打工者的心态去问问题,不要去问学什么,而要问自己你要干什么。大概从12年,大数据在中国有了爆发式增长,这就像坐马车的时代出现了汽车一样,你如果问汽车来了,我需要学习什么,答案很简单-“一本驾照”。所以正确的逻辑应该是,什么是大数据,大数据带来了什么,它能给我带来哪些改变,为了适应这种改变,我应该学习什么,所以学习是最后的一个问题,只有前面这些问题考虑清楚了,你的学习才有方向,才有意义,才有动力,到那时候你便知道自己要学什么。


要入门大数据的话,可关注我有个类似这问题的答案供参考,“做数据分析需要学什么”,除了业务知识,我首要建议你学好统计学,这个是大数据的“源”,总之不要把太多的时间花费在工具层面,这些都是有教程的,是用来提效的。如何与自己要做的事情结合,把业务问题转化为统计或者数学问题去解决,这个是需要花更多时间去思考的,也是你未来的竞争力所在。


任何一门新知识的学习,如同这个图像,螺旋式上升,前进过程有升有降。此图来自于Python可视化库pyecharts。

评论0 赞同0
  •  加载中...
whjin

whjin

回答于2022-06-28 14:17

大数据分析概念 

大数据分析是指对规模巨大的数据进行分析。大数据可以概括为5个V, 数据量大(Volume)、速度快(Velocity)、类型多(Variety)、价值(Value)、真实性(Veracity)。 

大数据作为时下最火热的IT行业的词汇,随之而来的数据仓库、数据安全、数据分析、数据挖掘等等围绕大数据的商业价值的利用逐渐成为行业人士争相追捧的利润焦点。随着大数据时代的来临,大数据分析也应运而生。

大数据分析工具介绍 

前端展现 

用于展现分析的前端开源工具有JasperSoft,Pentaho, Spagobi, Openi, Birt等等。 用于展现分析商用分析工具有Style Intelligence、RapidMiner Radoop、Cognos, BO, Microsoft Power BI, Oracle,Microstrategy,QlikVie、 Tableau 。 

国内的有BDP,国云数据(大数据魔镜),思迈特,FineBI等等。 

数据仓库 

有Teradata AsterData, EMC GreenPlum, HP Vertica 等等。 

数据集市 

有QlikView、 Tableau 、Style Intelligence等等。

大数据分析步骤 

大数据分析的六个基本方面 

1. Analytic Visualizations(可视化分析) 

  不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观的展示数据,让数据自己说话,让观众听到结果。

2. Data Mining Algorithms(数据挖掘算法) 

  可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。

3. Predictive Analytic Capabilities(预测性分析能力) 

  数据挖掘可以让分析员更好的理解数据,而预测性分析可以让分析员根据可视化分析和数据挖掘的结果做出一些预测性的判断。

4. Semantic Engines(语义引擎) 

  我们知道由于非结构化数据的多样性带来了数据分析的新的挑战,我们需要一系列的工具去解析,提取,分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。

 5.Data Quality and Master Data Management(数据质量和数据管理)

数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。 

假如大数据真的是下一个重要的技术革新的话,我们最好把精力关注在大数据能给我们带来的好处,而不仅仅是挑战。

6.数据存储,数据仓库 

数据仓库是为了便于多维分析和多角度展示数据按特定模式进行存储所建立起来的关系型数据库。在商业智能系统的设计中,数据仓库的构建是关键,是商业智能系统的基础,承担对业务系统数据整合的任务,为商业智能系统提供数据抽取、转换和加载(ETL),并按主题对数据进行查询和访问,为联机数据分析和数据挖掘提供数据平台。

评论0 赞同0
  •  加载中...
lyning

lyning

回答于2022-06-28 14:17

1、基础科学的能力

统计学,数学,逻辑学是数据分析的基础,是数据分析师的内功,内功不扎实,学再多都是徒劳。

掌握统计学,我们才能知道每一种数据分析的模型,什么样的输入,什么样的输出,有什么样的作用,开始我们并不一定要把每个算法都弄懂。

如果我们要做数据挖掘师,数据能力是我们吃饭的饭碗。如果你没有数学能力,用现成的模型也好,模块也好,也能做,但一定会影响你的技术提升,当然更影响你的职位晋升。

2、使用分析工具的能力

数据分析工具:SQL、SPSS、SAS、R、EXCEL等等吧,都必须掌握并且会应用,毕竟企业需要的不是学者而是应用型人才。

3、掌握编程语言的能力

不会Python、不会R,说你懂数据分析谁都不信。

4、逻辑思维的能力

逻辑思维对于数据分析来说特别重要,不单单是数理逻辑这块,还要有逻辑学的知识。反映商业数据里,大家可以理解为去搭建商业框架或者说是故事线,有逻辑的推进,结果才会另人信服。



评论0 赞同0
  •  加载中...
waterc

waterc

回答于2022-06-28 14:17

大数据需要的语言

Java、Scala、Python和Shell

分布式计算

分布式计算研究的是如何把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,然后把这些部分分配给许多服务器进行处理,最后把这些计算结果综合起来得到最终的结果。

分布式存储

是将数据分散存储在多台独立的设备上。采用的是可扩展的系统结构,利用多台存储服务器分担存储负荷,利用位置服务器定位存储信息,它不但提高了系统的可靠性、可用性和存取效率,还易于扩展。

分布式调度与管理

分布式的集群管理需要有个组件去分配调度资源给各个节点,这个东西叫yarn; 需要有个组件来解决在分布式环境下"锁"的问题,这个东西叫zookeeper; 需要有个组件来记录任务的依赖关系并定时调度任务,这个东西叫azkaban。

评论0 赞同0
  •  加载中...
LiveVideoStack

LiveVideoStack

回答于2022-06-28 14:17

hbase、hive、sqoop。大数据架构设计阶段:Flume分布式、Zookeeper、Kafka。大数据实时计算阶段:Mahout、Spark、storm。大数据数据采集阶段:Python、Scala。大数据商业实战阶段:实操企业大数据处理业务场景,分析需求、解决方案实施,综合技术实战应用等

评论0 赞同0
  •  加载中...
hidogs

hidogs

回答于2022-06-28 14:17

大数据是当下热门专业,未来的发展前景还是不错的。

评论0 赞同0
  •  加载中...
Tonny

Tonny

回答于2022-06-28 14:17

你看你是想学大数据还是数据分析,如果是数据分析可以用python做,具体可以咨询下百战程序员的老师。

评论0 赞同0
  •  加载中...
王陆宽

王陆宽

回答于2022-06-28 14:17

目前在我们数据行业内的日常用语中,数据分析和数据可视化这两个术语似乎已成为同义词。虽然说两者它都包含数据分析的内容,但实际上还是有一定的细微差别。就比如说

数据分析:它更多的强调的是一个逻辑思维能力,强调的是一个探索性的过程,通常从特定的问题开始。它需要好奇心、寻找答案的欲望和很好的韧性,因为这些答案并不总是容易得到的。

而数据可视化分析:它就在数据分析的基础上涉及到数据的可视化展示,从单个图表到全面的仪表盘。借助有效的可视化显著减少了受众处理信息和获取有价值见解所需的时间。加快了数据分析的效率,但是不是什么样的可视化都能达到我们的目的,还需要具备很多必要的条件。

评论0 赞同0
  •  加载中...
stormzhang

stormzhang

回答于2022-06-28 14:17

大数据开发:Ja-va、大数据基础、HDFS分布式文件系统、MapReduce分布式计算模型、 Yarn分布式资源管理器、Zookeeper分布式协调服务、Hbase分布式数据库、Hive分布式数据仓库、 FlumeNG分布式数据采集系统、Sqoop大数据迁移系统、Scala大数据黄金语言、 kafka分布式总线系统、Spark体系...

数据分析与挖掘:Python基础、关系型数据库MySQL、文档数据库MongoDB、内存数据库Redis、网络爬虫、数据分析、数据处理、数据分析处理进阶等

评论0 赞同0
  •  加载中...

最新活动

您已邀请0人回答 查看邀请

我的邀请列表

  • 擅长该话题
  • 回答过该话题
  • 我关注的人
向帮助了您的网友说句感谢的话吧!
付费偷看金额在0.1-10元之间
<