大数据分布式处理SEARCH AGGREGATION

首页/精选主题/

大数据分布式处理

大数据平台

...rm(简称 USDP),是 UCloud 推出的云上智能化、轻量级的大数据基础服务平台,能够帮您快速构建起大数据的分析处理能力。 USDP 构建于 UCloud 的云服务上,无缝集成云端 IaaS 资源能力,通过自研的 USDP Manager 管理工具,支持用户...

大数据分布式处理问答精选

大数据分布的架构怎么做调优呢?

回答:这个太范化了吧。大数据架构选择的方案就有很多,海量数据的即席查询本省就是业内目前的痛点,暂时没有太好的解决方案,kylin等框架也只是一个折中方案,如果你不是要求海量数据分析的秒级响应的话sparkSql、presto等都是不错的方案,分钟级别可以返回。

Paul_King | 422人阅读

分布式处理、分布式存储方面新的研究方向有哪些?

回答:分布式处理,分布式系统(其实也包含分布式存储系统)一直把RAS、MTBF、MTTR等作为可靠性衡量指标,但是专业指标是CAP指标,可用性作为其中重要因素之一。CAP理论阐述了在分布式系统的设计中,没有一种设计可以同时满足一致性,可用性和分区容错性。所以一个好的分布式系统,必须在架构上充分考虑上述指标。分布式系统设计中,BASE理论作为CAP理论的折中或延伸,在分布式系统中被大量使用。分布式系统的可...

lolomaco | 1047人阅读

搭建私有云平台:Hadoop还是选择OpenStack?

回答:首先建议题主描述清楚应用场景,否则别人做的方案可能都不符合需求。就Hadoop和OpenStack的纠结而言,支撑数据分析用前者,做资源管理用后者。=================补充=============题主的需求,实质是搭建一个IoT实时大数据平台,而不是一般意义的私有云。IoTa大数据平台除了数据采集和结果反馈,其余部分和一般的大数据平台相差不多。OpenStack长于管理VM资源管理...

MonoLog | 867人阅读

为什么SQL处理数据比Java快?

回答:使用SQL处理数据时,数据会在数据库内直接进行处理,而且sql处理本身可以对sql语句做优化,按照最优的策略自动执行。使用Java处理时,需要把数据从数据库读入到Java程序内存,其中有网络处理和数据封装的操作,数据量比较大时,有一定的延迟,所以相对来说数据处理就慢一些。当然,这个只是大体示意图,实际根据业务不同会更复杂。两者侧重的点不同,有各自适合的业务领域,需要根据实际情况选用合适的方式。

stefanieliang | 1598人阅读

你处理过的最大的数据量是多少?你是如何处理的?

回答:我是做JAVA后台开发的,目前为止最多处理过每天600万左右的数据!数据不算特别多,但是也算是经历过焦头烂额,下面浅谈下自己和团队怎么做的?后台架构:前置部门:负责接收别的公司推过来的数据,因为每天的数据量较大,且分布不均,使用十分钟推送一次报文的方式,使用batch框架进行数据落地,把落地成功的数据某个字段返回给调用端,让调用端验证是否已经全部落地成功的,保证数据的一致性!核心处理:使用了spr...

李增田 | 1066人阅读

大数据时代,如何理解“大数据”?

回答:目前阶段大数据技术及体系已经逐渐趋于成熟,不再是以概念贯穿的模式,大数据越来越多的被使用,伴随互联网化的发展更多的企业信息化已经由IT时代转变为DT时代,以数据为核心,用数据进行决策,基于数据驱动企业的创新与发展,相信在将来大数据也会有更广泛的应用空间,对于大数据的理解主要分为以下几个层面。1.数据来源:对于大数据时代而言更多强调基于业务数据的沉淀,在一定规模的数据上进行进一步的分析、处理、转换,...

arashicage | 955人阅读

大数据分布式处理精品文章

  • 数据技术原理与应用》第一章-数据概述

    ...和数据处理与分析层,由此可概括的两大核心技术: ① 分布式存储 解决海量数据的存储问题 一台机器无法存储,我们就借助集群进行分布式存储 ② 分布式处理 解决海量数据的处理问题 一台机器无法高效完成数据处理,...

    1fe1se 评论0 收藏0
  • 数据是什么?

    ...储技术的发展变得步履蹒跚,赶不上数据发展的速度时,分布式存储成为了必然选择,非结构型数据也对存储格式提出了新的要求。层出不穷的数据源也使得数据量产生了井喷似的迅猛增长。此时分布式存储与NoSQL的诞生回应了...

    DirtyMind 评论0 收藏0
  • 数据是什么?

    ...储技术的发展变得步履蹒跚,赶不上数据发展的速度时,分布式存储成为了必然选择,非结构型数据也对存储格式提出了新的要求。层出不穷的数据源也使得数据量产生了井喷似的迅猛增长。此时分布式存储与NoSQL的诞生回应了...

    lifefriend_007 评论0 收藏0
  • 十年回顾:Hadoop老矣,尚能饭否?

    ...上的海量数据处理问题而设计的。Google提出了一整套基于分布式并行集群方式的基础架构技术,利用软件的能力来处理集群中经常发生的节点失效问题。Google使用的大数据平台主要包括五个相互独立又紧密结合在一起的系统:分...

    gyl_coder 评论0 收藏0
  • 数据学习路线

    ...数据的收集。现在的中大型项目通常采用微服务架构进行分布式部署,所以数据的采集需要在多台服务器上进行,且采集过程不能影响正常业务的开展。基于这种需求,就衍生了多种日志收集工具,如 Flume 、Logstash、Kibana 等,...

    widuu 评论0 收藏0
  • Chapter1 数据概述

    ...析这两个层面。 1.4.2两大核心技术 两大核心技术指的是分布式存储、分布式处理。 分布式存储:解决海量数据的存储问题。单机无法存储海量数据时,就借助集群进行分布式存储。 分布式处理:解决海量数据的处理问题。单...

    Dean 评论0 收藏0
  • BI和数据你能分清吗?

    ...分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。 大数据需要特殊的技术,以有效...

    gclove 评论0 收藏0
  • 走进数据的世界

    ...大数据怎么存储 目前存储大数据一般采用NoSQL (Not Only SQL)分布式数据库。 传统的数据库如Oracle、MySql等都是关系型数据库,存储的是结构化的数据,可以通过SQL语句进行增删改查等操作。但是NoSQL是一种可以水平向扩展以及分布...

    lewinlee 评论0 收藏0
  • 数据与Hadoop之间是什么关系

    ...he(阿帕切) 的一个开源项目,它是一个对大量数据进行分布式处理的软件架构,在这个架构下组织的成员HDFS(Hadoop分布式文件系统),MapReduce、Zookeeper(一个针对大型分布式系统的可靠协调系统)、 HBase 、hive(基于Hadoop的一个数据...

    Michael_Lin 评论0 收藏0
  • 学习Hadoop数据基础框架

    ...统,可以多达几万台机器甚至更多。 Hadoop最初主要包含分布式文件系统HDFS和计算框架MapReduce两部分,是从Nutch中独立出来的项目。在2.0版本中,又把资源管理和任务调度功能从MapReduce中剥离形成YARN,使其他框架也可以像MapReduce...

    amc 评论0 收藏0
  • 什么是数据

    ...件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。Hadoop框架中最核心设计就是:HDFS和MapReduce。HDFS提供了海量数据的存储,MapReduce提供了对数据的计算。Hadoop的发行版除了社区的Apache hadoop外,cloudera,hortonwork...

    learn_shifeng 评论0 收藏0
  • 数据分析技术与应用

    ...析技术 常见的大数据分析技术主要由以下几部分构成: 分布式的文件系统存储海量的非结构化数据(例如:hdfs等) 分布式的离线计算系统,对业务数据批量处理。(例如:mapreduce等) 分布式的实时计算系统,实时对业务数据...

    shinezejian 评论0 收藏0
  • 数据分析技术与应用

    ...析技术 常见的大数据分析技术主要由以下几部分构成: 分布式的文件系统存储海量的非结构化数据(例如:hdfs等) 分布式的离线计算系统,对业务数据批量处理。(例如:mapreduce等) 分布式的实时计算系统,实时对业务数据...

    Youngdze 评论0 收藏0
  • Hadoop数据生态系统及常用组件简介

    ...数据,这时候可以使用Hadoop,它是由Apache基金会所开发的分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,编写和运行分布式应用充分利用集群处理大规模数据。Hadoop可以构建在廉价的机器上,比如我们淘汰的...

    BenCHou 评论0 收藏0
  • 想学数据数据处理的开源框架推荐

    ...ache.org) 这是Hadoop生态系统中的可扩展的、具有容错性的分布式文件系统。将商用服务器添加到集群中即可扩展HDFS。已知的最大集群包括了大约4500个节点和高达128PB的数据。HDFS支持并行读取和写入数据。HDFS系统中的带宽随节点...

    ralap 评论0 收藏0

推荐文章

相关产品

<