学sparkSEARCH AGGREGATION

首页/精选主题/

学spark

托管Hadoop集群

...基于 Hadoop 框架的大数据综合处理平台,提供开箱即用的 Spark、HBase、Presto、Hive 等大数据生态常见组件,同时可选 Hue、Sqoop、Oozie、Pig 等多种辅助工具。 为满足存储计算分离的需求,UHadoop 现已支持独立管理的 HDFS 存储集群,可...

学spark问答精选

Spark和Hadoop对于大数据的关系?

回答:Hadoop生态Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件。Apache Hadoop软件库是一个框架,该框架允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。 它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。 库本身不是设计用来依靠硬件来提供高可用性,而是设计为在应用程序层检测和处理故障,因此可以在计算机集群的顶部提供高可用性服务,...

娣辩孩 | 1214人阅读

大数据Spark技术是否可以替代Hadoop?

回答:1998年9月4日,Google公司在美国硅谷成立。正如大家所知,它是一家做搜索引擎起家的公司。无独有偶,一位名叫Doug Cutting的美国工程师,也迷上了搜索引擎。他做了一个用于文本搜索的函数库(姑且理解为软件的功能组件),命名为Lucene。左为Doug Cutting,右为Lucene的LOGOLucene是用JAVA写成的,目标是为各种中小型应用软件加入全文检索功能。因为好用而且开源(...

ctriptech | 628人阅读

Hadoop与Spark相比有存在优势的方面吗?

问题描述:该问题暂无描述

Object | 641人阅读

请问USDP社区版2.x怎么安装Spark2.X

回答:可以自行在某些节点上尝试安装 Spark 2.x,手动修改相应 Spark 配置文件,进行使用测试,不安装 USDP 自带的 Spark 3.0.1

316750094 | 715人阅读

Spark SQL和Shark在架构上有哪些区别?

回答:Spark Shark |即Hive onSparka.在实现上是把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,Shark获取HDFS上的数据和文件夹放到Spark上运算.b.它的最大特性就是快以及与Hive完全兼容c.Shark使用了Hive的API来实现queryparsing和logic plan generation,最后的Physical...

liaoyg8023 | 778人阅读

学spark精品文章

  • 从小白程序员一路晋升为大厂高级技术专家我看过哪些书籍?(建议收藏)

    ...》 《Hadoop应用开发技术详解》 《Hadoop硬实战》 《Hadoop Spark大数据巨量分析与机器学习整合开发实战 》 《HBase企业应用开发实战》 《HBase权威指南》 《Learning HBase中文版》 《Hive编程指南》 《Kafka技术内幕》 《Mahout实战》 《Meso...

    sf_wangchong 评论0 收藏0
  • 连城:大数据场景下的“搔到痒处”和“戳到痛处”

    .../www.ituring.com.cn/article/179495 连城,Databricks工程师,Apache Spark committer。《Erlang/OTP并发编程实战》与《Erlang并发编程(第一篇)》译者。目前从事Apache Spark中结构化数据分析组件Spark SQL的开发。 在做Spark之前,连城从来没有做过...

    qqlcbb 评论0 收藏0
  • 连城:大数据场景下的“搔到痒处”和“戳到痛处”

    .../www.ituring.com.cn/article/179495 连城,Databricks工程师,Apache Spark committer。《Erlang/OTP并发编程实战》与《Erlang并发编程(第一篇)》译者。目前从事Apache Spark中结构化数据分析组件Spark SQL的开发。 在做Spark之前,连城从来没有做过...

    endiat 评论0 收藏0
  • 工作4年后的一些思考

    ...做面试官,带团队。技术上刚开始用 Hadoop 开发,后来用 Spark。16年的时候线上业务直接用 Spark 来做算是比较早的尝试了。由于当时各种资料不多,踩了很多坑,那时候刚毕业也比较拼,有一段时间基本上天天在公司。遇到实在...

    lauren_liuling 评论0 收藏0
  • [原]海纳百川 有容乃大:SparkR与Docker的机器习实战

    ...op或者Java,我们更倾向于把精力放在建模和算法设计上,SparkR和Docker的完美结合,让R的计算直接从一架战斗机的当兵作战华丽转变为一个航空母舰战斗群!不仅仅简化了分布式计算的操作,还简化了安装部署的环节,我们只几...

    CHENGKANG 评论0 收藏0
  • [原]海纳百川 有容乃大:SparkR与Docker的机器习实战

    ...op或者Java,我们更倾向于把精力放在建模和算法设计上,SparkR和Docker的完美结合,让R的计算直接从一架战斗机的当兵作战华丽转变为一个航空母舰战斗群!不仅仅简化了分布式计算的操作,还简化了安装部署的环节,我们只几...

    zhongmeizhi 评论0 收藏0
  • 习大数据分析要什么基础,零基础入门ok吗?

    ...虚拟机搭建多台Linux虚拟机,从而构建Hadoop集群,再建立spark开发环境,完成大数据环境的配置搭建。也是学习大数据的第一步。 Hadoop生态体系HDFS分布式文件系统;MapReduce分布式计算模型;Yarn分布式资源管理器;Zookeeper分布式...

    leap_frog 评论0 收藏0
  • 阿里,B站小伙伴奉献的中高级大数据运维习课程与规划,高薪原来需要掌握这些

    ...述,基本概念介绍   7.数仓架构设计剖析,建模介绍 4.6 Spark组件原理与常见使用操作   1.Spark概述,基本概念,前生今生   2.Spark的基本原理剖析,架构剖析   3.Spark的常见生产操作,命令讲解演示   4.Spark的维护,集群的配置,...

    renweihub 评论0 收藏0
  • 大数据习路线

    ...数据进行统一的处理,对应的处理框架有 Hadoop MapReduce、Spark、Flink 等; 流处理:对运动中的数据进行处理,即在接收数据的同时就对其进行处理,对应的处理框架有 Storm、Spark Streaming、Flink Streaming等。 批处理和流处理各有其...

    widuu 评论0 收藏0
  • 计算与Plumbing Work

    ...的工具,而不是解决问题。storm已经不再时髦了,那就换spark,同时再考察考察flink或者samza。 带着大数据的标题下的另外一个问题是复杂算法引入带来的分工问题。其实复杂算法和大数据是两个问题。很多用到模型训练的场景并...

    lijinke666 评论0 收藏0
  • TOP100summit:【分享实录-Microsoft】基于Kafka与Spark的实时大数据质量

    ...有挑战性。本文将介绍微软ASG大数据团队如何利用Kafka、Spark以及Elasticsearch来解决这个问题。 一.案例简介 本案例介绍了微软大数据平台团队设计和部署的基于开源技术(Kafka、Spark、ElasticsSearch、Kibana)的大数据质量监控平台...

    Guakin_Huang 评论0 收藏0
  • Python和R:哪个好?

    ...和机器学习框架对Python都提供了很好的支持,比如Hadoop、Spark、Tensorflow;同时,Python也有着强大的社区支持,特别是近年来随着人工智能的兴起,越来越多的开发者活跃在Python的社区中。 3、Python作为一种胶水语言,能够和其他...

    岳光 评论0 收藏0
  • 基于云计算的大数据平台基础设施建设实践

    ...面我提到的大数据是特指大数据基础平台,比如 Hadoop 、Spark 等,而不是指上层应用。 我会从四个方面和大家交流一下:云计算与大数据,云上大数据平台建设的挑战,大数据基础平台,数据格式。  一、云计算与大数据 相信...

    MadPecker 评论0 收藏0
  • Spark Streaming遇到问题分析

    Spark Streaming遇到问题分析 1、Spark2.0之后搞了个Structured Streaming 还没仔细了解,可参考:https://github.com/lw-lin/Coo... 2、Spark的Job与Streaming的Job有区别及Streaming Job并发控制: 先看看Spark Streaming 的 JobSet, Job,与 Spark Core 的 Jo...

    stormzhang 评论0 收藏0
  • Java好呢?还是C++更有前途?

    ...型web系统处理后台web业务的首选语言。此外,常用hadoop、spark、openstack等大数据与云计算开源框架,都是用Java开发的,Java已经成为大数据开发人员最喜欢的开发语言之一。作为C++开发人员的我,真的很羡慕Java语言中的完善的异...

    jiekechoo 评论0 收藏0

推荐文章

相关产品

<