{eval=Array;=+count(Array);}

问答专栏Q & A COLUMN

该如何学习大数据知识?

546669204546669204 回答0 收藏1
收藏问题

10条回答

Galence

Galence

回答于2022-06-28 15:11

谢谢邀请!

大数据是我的主要研究方向之一,同时也在带大数据方向的研究生,所以我来回答一下这个问题。

学习大数据首先要根据自身的知识结构选择学习方向,比如数学和统计学专业的学生可以选择数据分析方向,而计算机专业的学生可以选择大数据开发方向,不同的学习方向需要制定不同的学习计划。

虽然不同的学习方向往往需要学习不同的内容,但是对于零基础的学习者来说,以下三方面基础知识是都需要学习的:

第一:编程语言。不论是选择大数据分析方向还是大数据应用开发方向,掌握编程语言都是学习大数据的重要基础。目前在大数据领域应用比较广泛的语言包括Java、Python、Scala、R和Go等,其中Java在Hadoop平台应用比较多,而Scala在Spark平台应用比较普遍。从目前的应用趋势来看,学习Python则是不错的选择,既可以从事大数据开发,也可以从事大数据分析。

第二:大数据平台。学习大数据知识绕不过大数据平台,大数据平台承载了分布式存储和分布式计算的核心任务,所以大数据平台研发也是目前大数据领域的重要岗位。目前Hadoop和Spark是比较适合初学者学习的大数据平台,一方面是其开源的属性,另一方面Hadoop对于硬件的要求也比较低。

第三:算法。大数据技术的核心诉求是数据价值化,而目前数据价值化的主要方式就是数据分析,所以掌握算法不仅对于数据分析岗位非常重要,对于大数据开发岗位也具有现实的意义。可以说,大数据产业链内大量的岗位任务都要围绕算法展开,所以掌握算法是学习大数据技术的核心任务之一。学习算法可以从一些经典的算法开始,比如kNN、决策树、朴素贝叶斯、支持向量机等等。

我从事互联网行业多年,目前也在带计算机专业的研究生,主要的研究方向集中在大数据和人工智能领域,我会陆续写一些关于互联网技术方面的文章,感兴趣的朋友可以关注我,相信一定会有所收获。

如果有互联网、大数据、人工智能等方面的问题,或者是考研方面的问题,都可以在评论区留言!

评论0 赞同0
  •  加载中...
Thanatos

Thanatos

回答于2022-06-28 15:11

本人从事大数据以及相关行业,算是一个业内人士,说说我的看法,仅供参考。

首先大数据这几年特别热门,同时也带来了很多的就业。大数据的价值也越来越明显,尤其是人工智能的发展和即将到来5G,都离不开大数据这个基础!所以选择学习大数据对未来的发展还是挺不错的。但同时也要清楚一些问题!

首先是确定学习的方向:大数据是一个大概念,必须知道他都有那些部分,自己将来就业要选择那个方向。下面就说一下大数据就业的方向和技能需求以及岗位需求!仅供参考!!

一,大数据开发

从事大数据开发工程师

岗位职责

1、利用Hadoop、Spark等技术在分布式系统上对海量历史数据进行预处理,挖掘用户信

息;

2、参与大数据基础平台的搭建和维护;

3、负责广告投放项目管理平台研发;

4、负责大数据计算处理平台项目研发。

技术要求

1、熟练掌握c++/Java开发,具备扎实的程序设计基本功和学习能力

2、熟悉 Linux,熟悉 shell/perl/python/php 等脚本语言的一种或多种。

3、熟悉传统数据库MySQL。

4、熟悉MapReduce、Storm、Spark、Spark Streaming等大数据开发工具,对源代码

有一定研究者优先;

5、熟悉linux环境,熟悉shell等脚本编程;

6、有大规模数据处理和日志处理经验的优先。

7、有较强的人际沟通、协调能力,具备与技术人员沟通数据需求的能力;

8、具备良好的逻辑分析能力和解决实际问题的能力。

二,大数据运维

从事大数据运维工程师

岗位职责

1、负责大数据平台整体软硬件的日常运维; 

2、分析平台运行状态,进行性能优化; 

3、负责大数据平台运行故障的分析、定位和解决; 

4、负责新技术、新组件的技术探索、测试和应用; 

5、支撑运维自动化系统的设计和开发。 

岗位要求: 

1、 熟悉hadoop生态圈主要开源技术组件及其工作原理,能阅读相关源代码,能顺利阅读英文文档; 

2、熟悉软硬件设备、网络原理,有丰富的大数据平台部署、性能优化和运维经验;

3、熟悉Linux,熟悉cacti、ganglia、zabbix等运维软件,熟悉SaltStack、Ansible等自动化软件,有python、java、shell编程基础; 

4、工作认真负责,有较强的学习能力、动手能力和分析解决问题的能力; 

补充:

熟悉Hadoop/Hbase/Hive/Presto/Yarn/Spark/Storm/Kafka/Elasticsearch/Flume等开源项目,有运维优化经验者优先;

熟悉Linux操作系统的配置、管理及优化;

熟悉Python、Linux、shell,有ETL维护经验、电信行业大数据维护经验者优先

三,数据挖掘

从事数据挖掘工程师

岗位职责

1、对海量数据进行分析,建立数据挖掘算法,利用大数据对产品进行研究和建模,为用户提供评估和预测等功能;

2、参与/负责用户画像、推荐等系统搭建,参与核心产品推荐场景算法的研发和优化;

3、采用先进的数据挖掘和机器学习算法,为公司业务部门提供决策依据;

4、搭建数据挖掘系统和机器学习系统,实现智能平台的自动化流程。

1、具备强悍的编码能力,有扎实的数据结构和算法功底;

2、优秀的学习能力、独立分析问题和解决问题能力;

3、熟悉Linux开发环境,熟悉Python,PHP,Java等语言两种以上;

4、熟悉基本的数据分析方法、数据挖掘、机器学习算法;

5、熟悉SPSS/Modeler/R/Python等至少一种数据挖掘工具;

6、熟悉Hadoop/Spark,有Elasticsearch,Solr,Kafka,Flume等开源项目使用经验

7、有画像、广告、推荐,搜索等算法方向实际工作经验优先

四,BI(商务智能)工程师— (包括数据库开发、BI开发工程师、ETL开发、报表开发、BI咨询顾问)

岗位职责

1、独立负责业务数据收集整理,构建经营分析和报表系统;

2、通过专题分析,对业务问题进行深入分析,为业务的策略、产品优化提供数据支持;

3、 以数据驱动业务为目标,进行数仓研发工作但不局限于数仓;

4、 参与数据仓库ETL设计、开发和优化工作,保证数据准确、稳定、组织合理 

岗位要求

1、掌握Oracle、MySQL、ODPS等数据库开发技能,熟练应用开发、数据库原理和常用性能优化和扩展技术;

2、掌握数据仓库建设、熟悉大数据平台操作,离线计算Hive/MR研发、实时计算spark streaming/storm; 

3、熟悉ETL逻辑、OLAP设计和数据分析技术(聚类分析、回归分析、决策树等)、数据挖掘相关算法;

4、熟悉Linux系统环境开发,掌握shell、perl、python等至少一种开发语言。

6. 有较强的逻辑/概率思维能力,善于分析、归纳、描述、沟通、和解决问题。

补充(根据企业工具区别)

1、全面熟知数据仓库设计理念、设计方法,熟练掌握Informatica、Kettle、Automation等至少一种ETL工具;

2、熟练掌握SAP BO、MSTR、SmartBI、Cognos、QV等至少一种BI工具;

3、熟悉数据仓库,掌握BI相关工具,如ETL工具(SSIS, SAP DataService)、OLAP工具(SSAS)和前端展示工具(BO CR/Webi)

五,数据可视化

从事可视化工程师

岗位职责

1、负责大数据平台业务逻辑和数据可视化功能,数据可视化组件研发;    

2、搭建基础的可视化分析平台,设计数据分析应用的架构,实现实时数据调用与展示;

3、数据相关性分析与根因分析;

4、支持客户需求分析和数据分析。

岗位要求

1、熟练Web前端技术(SVG/HTML5/JavaScriptdeJS等);

2、熟练D3、Echarts、Three.js、WebGL等开源数据可视化库和技术;    

3、有Web服务器端编程语言(如Node/Java)开发经验优先;    

4、有blender(以及blender game engine)或者unity 3d或unreal engine等开发经验优先

一些BI岗位的详细介绍

BI工程师(开发、咨询、实施)

BI开发工程师

岗位职责

1、执行在框架设计的基础上完成具体组件的概要设计、详细设计编写;          

2、完成BI系统具体组件的代码编写、单元测试;                                 

3、参与BI系统报表平台技术架构设计,数据库结构设计;                  

4、参与BI系统数据仓库的构架、建模和实现。  

5、负责向需求方提供数据及业务分析服务,负责整体风控模型的优化,理解并掌握BI报表需求;

岗位要求

1、有数据仓库或统计分析类项目开发经验或较深的理论知识;

2、熟悉Cognos、Webfocus、ireport等数据分析报表开发工具和技术;

3、熟悉Linux/Unix服务器,并了解一些基本的操作命令;

4、至少熟悉Informix/Oracle/SQL Server等数据库中的一种,并在此基础上有过ETL程序或存储过程的开发。

5、能够熟练应用JSP/Servlet/JavaScript等WEB开发技术,熟悉Spring,Struts2和iBATIS等主流的开发框架,熟悉BIRT、JasperReports等开源报表工具;

6、熟悉Linux Shell、Perl等脚本语言,熟悉ORACLE数据库,PL/SQL编程;

7、熟悉BI系统技术框架,熟悉数据采集流程,对数据仓库有比较深入的了解;

8、熟悉行业经营分析系统(BI)架构及实现者优先。

BI咨询顾问

岗位职责

1、分析客户的数据要求;

2、负责Qlikview/Tableau BI项目的实施和报表开发;

3、负责校验数据,保障数据的准确;

4、 负责客户需求收集、分析,梳理业务流程解决方案,项目的拓展支撑;

5、撰写需求规格书及各类相关文档;

6、良好的团队合作、协调、问题处理能力;

岗位要求

1、对BI有系统的认知;

2、熟练使用Qlikview,Tableau等前端工具;

3、熟悉MS SQL Server,熟练运用SQL语言;

4、前端报表偏业务方向需熟悉主流报表工具或新兴前端报表工具Qlikview、Tableau等优先考虑;

6、后台数据处理需熟悉掌握至少一种后台ETL开发工具,例:Informatica powercenter、Datastage、OWB、微软DTS、Kettle等;

7、后台数据建模需熟练掌握至少一种数据挖掘算法和建模方法,了解建模;

8、良好的英文能力,能快速阅读和撰写英文技术文档者优先。

BI实施工程师

岗位职责

1、负责BI项目的需求调研与分析工作;

2、负责BI项目的方案设计、实施或项目管理工作;

3、参与公司BI产品和项目的实施开发工作。

岗位要求

1、良好的数据库基础,精通SQL,深入掌握Oracle或其他数据库,能够进行数据库调优;

3、熟悉ORACLE、MYSQL、SQLSERVER等主流数据库的安装及配置、熟悉SQL语句编写及ETL、BI实施工作;

3、熟悉LINUX操作系统安装及常用命令;

4、熟悉BI基础理论知识,使用过BI相关产品;

5、参与BI相关项目的实施工作;

6、熟悉TOMCAT、JDK等安装及参数配置;

7、具备较强的语言表达能力,能与客户顺畅沟通或产品介绍;

8、具备较强的学习与动手能力,能够适应全国范围内出差;

9、熟悉hadoop大数据及自动化运维工具经验者的待遇从优。

ETL工程师

岗位要求:

具备一般的JAVA应用开发能力;

熟悉Oracle下的分区,表空间, SQL性能调优等操作;

熟悉常用的ETL工具,如:kettle, informatica等;

熟悉常用的报表工具,如:Cognos等。

岗位职责:

负责行业生产交易系统数据仓库开发,存储过程编写,数据模型研究,大数据研究

六,数据分析工程师

岗位职责:

1、进行业务和企业经营行为分析,梳理业务规律和业务需求;

2、将业务需求转化为数据需求,发现数据应用场景,梳理指标体系;

3、使用合适的数据分析工具进行数据分析和模型设计;

4、提出基于数据的结果和分析建议,根据分析结果进行行业研究、评估和预测;

5、编写数据分析报告;

6、完成领导交办的其他工作。

岗位要求

1、本科以上学历,计算机、数学、统计学等相关专业;

2、深刻理解大数据分析原理及相关应用;

3、熟练掌握主流数据库技术;

4、精通数据分析、挖掘工具与方法,如SAS、R、Python、EXCEL等;

5、敏锐的数据观察和分析能力,及时发现和分析其中隐含的变化和问题并给出建议;

6、良好的沟通能力和团队精神,较强的学习能力,能承担一定的工作压力;

还有就是要怎么学习,要参加培训?还是自学?,培训花费大但是有学习环境和氛围并且有人指导可以全身心的投入学习中。要是自学在自己没有基础的情况下是容易走弯路的而且花费时间会很长!

最后就是学历问题,大专之上学习较好,找工作还算能行,不过大专找工作也有点吃力但是也能找到!要是你大学的专业是计算机或者数学统计学相关专业可能出来很有优势,是加分项!

希望能够帮到你,欢迎关注,讨论




评论0 赞同0
  •  加载中...
anonymoussf

anonymoussf

回答于2022-06-28 15:11

感谢邀请!

以下回答属于个人理解,不喜勿喷!

首先、想学习大数据,就需要知道什么才是大数据!要学习哪些东西?

涉及大数据的东西其实太多了。

比如服务器负载均衡搭建,是不是数据大数据呢?数据库分库分表,主从数据库是不是数据大数据呢?

这个要从大数据的起源来说,大数据起源是google公司写的三篇论文开始说。

google公司是世界上软件技术最强之一,人家公司自己有自己的大数据平台,发布了三篇论文,分别是Google-File-System和Google-Bigtable以及Google-MapReduce。这三篇论文发布之后,才有的大数据的概念。

大数据中的File-System现在学习的叫hdfs。(Hadoop Distributed File System)

Hadoop分布式文件系统,利用linux,来做的分布式文件系统。

MapReduce是一种编程模型。

Bigtable就是超大数据库存储了。

如果有兴趣可以私信我。我可以给你一些学习的视频资料

评论0 赞同0
  •  加载中...
jcc

jcc

回答于2022-06-28 15:11

如果你从事大数据研发类工作,你需要学习一门开发语言,JAVA或者Python,用于开发大数据相关的数据存储、抽取、计算分析等任务。

如果你从事大数据运维类工作,你需要了解Hadoop、Hbase、MongDB、Spark等大数据产品。

最重要的是,你要了解运用大数据技术的相关行业,没有业务知识,大数据技术也只是技术,并不能产生更多的价值。

评论0 赞同0
  •  加载中...
figofuture

figofuture

回答于2022-06-28 15:11

对于大数据想必了解过的人和想要学习大数据的童鞋都是有所了解的,知道大数据培训相关的一些学习内容都有个大概的了解,但是对于大数据培训学习内容的一些比较详细的内容还是有所差距的,我们学习大数据的主要目的就是未来以后可以到大企业去做相关的工作,拿到客观的薪资。

那么这就需要我们了解企业对于大数据技术的需求是什么,大数据培训机构大数据课程内容是否包含这些内容。接下来带大家简单了解一下。

第一阶段Java语言基础,此阶段是大数据刚入门阶段,主要是学习一些Java语言的概念、字符、流程控制等。

第二阶段Javaee核心了解并熟悉一些HTML、CSS的基础知识,JavaWeb和数据库,Linux基础,Linux操作系统基础原理、虚拟机使用与Linux搭建、Shell 脚本编程、Linux 权限管理等基本的 Linux 使用知识,通过实际操作学会使用。

第三阶段 Hadoop 生态体系,Hadoop 是大数据的重中之重,无论是整体的生态系统、还是各种原理、使用、部署,都是大数据工程师工作中的核心,这一部分必须详细解读同时辅以实战学习。

第四阶段Spark生态体系,这也是是大数据非常核心的一部分内容,在这一时期需要了解Scala语言的使用、各种数据结构、同时还要深度讲解spark的一系列核心概念比如结构、安装、运行、理论概念等。


2021大数据学习路线图:


评论0 赞同0
  •  加载中...
lx1036

lx1036

回答于2022-06-28 15:11

本人工作以来一直在大数据领域深耕,对于大数据的入门者有少许的建议。大数据领域的工作方向主要分为以下几类:

1.计算平台方向

2.数据处理方向

3.数据分析方向

4.算法应用方向

目前大部分公司的子部门也基本按这些进行细分,上述各个领域的侧重点也不一样。

1.计算平台方向。自从07年hadoop技术横空出世以后,使得廉价的机器也能部署成分布式计算环境,所以这块技术主要围绕着hadoop生态。这个需要学习hdfs分布式文件,hbase或hive分布式数据库技术,spark或者flink等分布式计算技术,zookeeper等分布式协调技术等。根据个人喜好可以侧重底层技术的优化及维护,或者基于这些技术的应用开发。

2.数据处理方向,大致是指ETL工程师。该职位主要是加工处理各个数据源的数据,包括日志收集的、业务库产生的等。根据这些数据供其他工种的同学进行使用,比如产生各种报表,或者拿来给算法做训练。这一块侧重sql技术或者python技术,他们更侧重于对业务的理解,技术相对弱化一点。

3.数据分析方向。这块的岗位主要是数据分析师,实际中使用比较多的是sql和excel。如果把业务比喻成人,数据就是血液,而数据分析师就是通过血液进行人体症状判断的医生。很多时候数据分析师比业务方还懂业务,他们需要分析业务的痛点,通过分析数据寻找解决方案。这块需要很强的逻辑分析能力和沟通能力。

4.算法工程师。这个基本上处于大数据食物链顶端的工种。他们需要精通高数、高代、概率论与统计等等数据基础,同时需要掌握python或scala至少一门语言,需要掌握机器学习或深度学习的知识。门槛相对其他工种稍高一点。基础的算法工程师一般调用算法开发包进行业务开发,同时进行参数调优。高级的算法工程师需要看论文自己实现算法,或者根据业务情况优化数学公式。如果想从事这块,你需要很扎实的数学基础,并且要热爱数学才能持之以恒坚持下去。

评论0 赞同0
  •  加载中...
makeFoxPlay

makeFoxPlay

回答于2022-06-28 15:11

1.首先你需要对大数据有一个清晰地认知,什么是大数据?大数据都能干什么?我对大数据感兴趣吗?能坚持下来吗?我要学习大数据现在有什么基础?还有什么地方要补足?学习大数据之前千万要想好这些,要不很有可能你学习到一个阶段就半途而废了。

2.如果你之前没有编程的经历,那么你要选择一门编程语言去辅助你做大数据项目。我建议学习Java,现在Java培训机构很多,网上的视频文章等学习资源也很多,而且大数据相关技术栈中有相当一部分也是Java开发的,所以懂Java对于你学习大数据有很大的帮助。

3.如果你有Java基础,或者通过学习已经掌握了JavaWeb相关的技术,例如数据库,数据结构,JQuery,Spring等,就可以开始接触大数据相关的技术了。这一阶段需要学习的知识很多,批处理框架Hadoop,分布式文件管理系统HDFS,流式计算框架Spark,交互式框架Hive等,另外你还需要恶补一些数学知识,如概率论,离散数学,统计学等。

4.实践是检验真理的唯一标准,理论知识充足时候一定要实践,记住,实践非常重要,最好结合身边的应用场景,做一到两个大数据的项目,跟随着项目,你才能以最快的速度成长。

5.不断地学习新的知识技术,多去拜读大数据相关的论文,其实到大数据层面,更多的是解决问题的思路而不是解决问题的办法。

6.坚持,凑个偶数。

评论0 赞同0
  •  加载中...
CloudDeveloper

CloudDeveloper

回答于2022-06-28 15:11

额,感觉你的问题问的有点泛。目前我也在学大数据,个人建议可以从以下几个步骤开始学习大数据。第一、先学习基础知识,基础知识包括java se,Linux,数据库之类的。第二、学习Hadoop,Spark,Yarn,MapReduce之类的,数据存储和处理架构。第三、开始做点稍微有含金量的项目之类的。这仅仅是个人的感觉,由于目前我也在学习阶段,回答的可能有欠缺,欢迎各路大佬批评指正。


评论0 赞同0
  •  加载中...
blair

blair

回答于2022-06-28 15:11

可以从实际用途出发。

先问自己,为什么要学大数据,希望找一份怎样的工作,大数据与现在学习的专业间是否可以建立起关联?

然后以终点为起点,朝着目标,分析一下需要哪块大数据技能?大数据内容和方向都很多,要从目标倒推,选择你需要的部分。

最后,全网搜索网课,然后试听,满意的话就可以报名学习啦!

现在信息资源那么丰富,用心学习肯定能进步很快,加油!

评论0 赞同0
  •  加载中...
X1nFLY

X1nFLY

回答于2022-06-28 15:11

你好,很高兴回答你的问题。

很多萌新会问:大数据好学吗?大数据好就业吗?其实啊,在学习大数据的过程中,重要的一点是我们要找准自己的定位。学好大数据开发技术,自然能够有一个非常不错的工作。在大数据学习过程中,你需要注意以下几点:

首先,你要了解一下自己的实际能力水平,比如零基础学习大数据从自学角度来看是完全不可行的。然后从容应对以后的学习途径。在学习中需要更加明白你的目标,你迈向下一步的步伐,在大方向确定后再具体到小细节,不能有丝毫的马虎。

其次,你需要了解如今的市场行情,需要掌握什么技能才能找到一份大数据开发的工作,现在公司需要什么人才,将自己的技能与企业需求匹配,这个就是你学习的一个方向。

重要的是,你要确定自己的学习方式。如果你想系统学习,可以跟着老师的进度,但也要有自己的计划,一个系统的学习规划会让你的学习更加有序进行。

总结一下就是,你要知道自己每天学习什么,很多大数据小白在入门阶段的时候,兴致勃勃,但三分钟热度一过,或者遇到了非常棘手的难题,学着学着就放弃了,或者是明明在学习,但是一段时间以后根本不知道自己在学习什么,这样非常迷茫一点计划没有,肯定是学不会大数据的,所以学习大数据要摆正好心态,有耐心细心一点,要清楚地知道自己每天在学习什么。

如果你认准了想要在大数据行业进行发展,也为了以后能有个高薪工作,有一个好的发展方向,且对自己树立良好的自信心的话,建议可以选择一个靠谱的培训机构进行系统学习,努力就会有收获哦!

我现在学习的南京安德门的中博开设了北美大数据班,前几天出来了就业喜报,平均薪资都在10k+,有兴趣的朋友可以来看看了解下,当然了,合不合适还是看自己。

评论0 赞同0
  •  加载中...

相关问题

最新活动

您已邀请0人回答 查看邀请

我的邀请列表

  • 擅长该话题
  • 回答过该话题
  • 我关注的人
向帮助了您的网友说句感谢的话吧!
付费偷看金额在0.1-10元之间
<