spark社区SEARCH AGGREGATION

首页/精选主题/

spark社区

托管Hadoop集群

...基于 Hadoop 框架的大数据综合处理平台,提供开箱即用的 Spark、HBase、Presto、Hive 等大数据生态常见组件,同时可选 Hue、Sqoop、Oozie、Pig 等多种辅助工具。 为满足存储计算分离的需求,UHadoop 现已支持独立管理的 HDFS 存储集群,可...

spark社区问答精选

请问USDP社区版2.x怎么安装Spark2.X

回答:可以自行在某些节点上尝试安装 Spark 2.x,手动修改相应 Spark 配置文件,进行使用测试,不安装 USDP 自带的 Spark 3.0.1

316750094 | 706人阅读

Spark和Hadoop对于大数据的关系?

回答:Hadoop生态Apache™Hadoop®项目开发了用于可靠,可扩展的分布式计算的开源软件。Apache Hadoop软件库是一个框架,该框架允许使用简单的编程模型跨计算机集群对大型数据集进行分布式处理。 它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。 库本身不是设计用来依靠硬件来提供高可用性,而是设计为在应用程序层检测和处理故障,因此可以在计算机集群的顶部提供高可用性服务,...

娣辩孩 | 1181人阅读

大数据Spark技术是否可以替代Hadoop?

回答:1998年9月4日,Google公司在美国硅谷成立。正如大家所知,它是一家做搜索引擎起家的公司。无独有偶,一位名叫Doug Cutting的美国工程师,也迷上了搜索引擎。他做了一个用于文本搜索的函数库(姑且理解为软件的功能组件),命名为Lucene。左为Doug Cutting,右为Lucene的LOGOLucene是用JAVA写成的,目标是为各种中小型应用软件加入全文检索功能。因为好用而且开源(...

ctriptech | 618人阅读

Hadoop与Spark相比有存在优势的方面吗?

问题描述:该问题暂无描述

Object | 632人阅读

Spark SQL和Shark在架构上有哪些区别?

回答:Spark Shark |即Hive onSparka.在实现上是把HQL翻译成Spark上的RDD操作,然后通过Hive的metadata获取数据库里的表信息,Shark获取HDFS上的数据和文件夹放到Spark上运算.b.它的最大特性就是快以及与Hive完全兼容c.Shark使用了Hive的API来实现queryparsing和logic plan generation,最后的Physical...

liaoyg8023 | 765人阅读

spark社区精品文章

  • 飞起来的大象-Hadoop从离线到在线

    ...,欲与Hadoop试比高。2014年Spark是个爆发年,这一年里Spark社区快速发布了多个版本,较高版本已经到了1.2.0。Spark先是废弃了Shark然后大力发展Spark SQL,与此同时Spark Streaming也更为成熟;Spark社区内部优化无数,空前活跃,各种会...

    Rango 评论0 收藏0
  • BC Spark开发者社区携手链得得,联合发起「区块链全球高校巡讲 — 北京理工大学站」为北理师生带

    ...、培养体系不完善等问题。自2018年9月起,BC Spark开发者社区秉承教育培训只是手段,完善研发协作环境与人才对接才是解决问题的根本这一开源精神,联合区块链媒体链得得,以及各大知名高校发起「全球⾼校区块链技术...

    woshicixide 评论0 收藏0
  • SparkSQL 在有赞的实践

    ...务会影响业务对外服务的承诺。同时,随着 Spark 以及其社区的不断发展,Spark 及 Spark SQL 本身技术的不断成熟,Spark 在技术架构和性能上都展示出 Hive 无法比拟的优势。 从开始上线提供离线任务服务,再到 Hive 任务逐渐往 SparkSQ...

    hzx 评论0 收藏0
  • SparkSQL 在有赞的实践

    ...务会影响业务对外服务的承诺。同时,随着 Spark 以及其社区的不断发展,Spark 及 Spark SQL 本身技术的不断成熟,Spark 在技术架构和性能上都展示出 Hive 无法比拟的优势。 从开始上线提供离线任务服务,再到 Hive 任务逐渐往 SparkSQ...

    Xufc 评论0 收藏0
  • 一篇文看懂Hadoop:风雨十年,未来何去何从

    ...稳定版, 已经从传统的Hadoop三驾马车HDFS,MapReduce和HBase社区发展为60多个相关组件组成的庞大生态,其中包含在各大发行版中的组件就有25个以上,包括数据存储、执行引擎、编程和数据访问框架等。Hadoop在2.0将资源管理从MapRedu...

    Hanks10100 评论0 收藏0
  • Hadoop生态系统在壮大:十大炫酷大数据项目

    ...在使用诸多项目,开发大数据技术,并将它们捐献给开源社区,以便进一步发展和采用,其中就包括Spark、Hive、HBase和Storm。在网飞和领英等一些企业,其中一些技术已用于生产环境。它们让企业组织能够实时处理海量数据,并...

    lyning 评论0 收藏0
  • 应用案例:SequoiaDB+Spark搭建医院临床知识库系统

    ...了整个数据系统的性能和稳定性。 本文源自巨杉数据库社区用户实际应用案例欢迎关注和加入巨杉数据库开源社区 SequoiaDB巨杉数据库2.6最新版下载 SequoiaDB巨杉数据库技术博客 SequoiaDB巨杉数据库社区

    guqiu 评论0 收藏0
  • IBM美女工程师Holden Karau:寻找友善的人一起共事

    ...未来将会发生什么,尤其在数量如此多的人都在参与开源社区的情况下。我相信久而久之,Spark会取代很多Map/Reduce系统和定制化系统,而其他系统则会把Spark作为执行引擎。但是仍然会有更适合定制化系统来完成的用例。 问:对...

    MudOnTire 评论0 收藏0
  • 三分天下,分久必合:IBM的Kubernetes on Mesos探索之路

    ...title是IBM软件架构师,但我更喜欢下面这个角色: kube-mesos社区负责人;我在Mesos和Kubernetes两个社区都有不同的贡献。国内我是较早一批进入Mesos社区的,2014年开始通过meetup认识了很多技术圈的朋友,后来由于公司的需要就转到了K...

    miguel.jiang 评论0 收藏0
  • 三分天下,分久必合:IBM的Kubernetes on Mesos探索之路

    ...title是IBM软件架构师,但我更喜欢下面这个角色: kube-mesos社区负责人;我在Mesos和Kubernetes两个社区都有不同的贡献。国内我是较早一批进入Mesos社区的,2014年开始通过meetup认识了很多技术圈的朋友,后来由于公司的需要就转到了K...

    Charles 评论0 收藏0
  • Leaf in the Wild: Stratio整合Apache和MongoDB为世界上最大的银行

    ...-customer-insights-for-one-of-worlds-largest-banks欢迎关注MongoDB中文社区获取更多关于MongoDB的信息。 毫无疑问,Apache Spark现在非常热门。它是Apache软件基础中最活跃的大数据项目,最近也被IBM神化——其中IBM还投入了3, 500个工程师来...

    BDEEFE 评论0 收藏0
  • 连城:大数据场景下的“搔到痒处”和“戳到痛处”

    ...数据流水线都迁移到Spark上来。百度之所以前两年在Spark社区里声音不多,也是因为他们在做内部系统的整合和消化。现在百度自己的BMR服务已经出来了,说明内部的整合和消化已经基本完毕了。 问:你现在的工作重点还是在Spa...

    qqlcbb 评论0 收藏0
  • 连城:大数据场景下的“搔到痒处”和“戳到痛处”

    ...数据流水线都迁移到Spark上来。百度之所以前两年在Spark社区里声音不多,也是因为他们在做内部系统的整合和消化。现在百度自己的BMR服务已经出来了,说明内部的整合和消化已经基本完毕了。 问:你现在的工作重点还是在Spa...

    endiat 评论0 收藏0
  • 想学大数据?大数据处理的开源框架推荐

    欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文讨论大数据处理生态系统和相关的架构栈,包括对适应于不同任务的多种框架特性的调研。除此之外,文章还从多个层次对框架进行深入研究,如存储,资...

    ralap 评论0 收藏0
  • Spark解决一些经典MapReduce问题

    ...标榜为快如闪电的集群计算。它拥有一个繁荣的开源社区,并且是目前最活跃的Apache项目。Spark提供了一个更快、更通用的数据处理平台。和Hadoop相比,Spark可以让你的程序在内存中运行时速度提升100倍,或者在磁盘上运行...

    oneasp 评论0 收藏0

推荐文章

相关产品

<