处理大数据量_处理大数据量相关云计算内容

大数据平台

...大数据基础服务平台，能够帮您快速构建起大数据的分析处理能力。 USDP 构建于 UCloud 的云服务上，无缝集成云端 IaaS 资源能力，通过自研的 USDP Manager 管理工具，支持用户创建资源独享的大数据集群，在集群中部署 Hadoop、Hive、...

立即购买论坛提问专栏学习 1对1咨询

这样搜索试试？

处理大数据量问答精选换一批

你处理过的最大的数据量是多少？你是如何处理的？

回答:我是做JAVA后台开发的，目前为止最多处理过每天600万左右的数据！数据不算特别多，但是也算是经历过焦头烂额，下面浅谈下自己和团队怎么做的？后台架构:前置部门:负责接收别的公司推过来的数据，因为每天的数据量较大，且分布不均，使用十分钟推送一次报文的方式，使用batch框架进行数据落地，把落地成功的数据某个字段返回给调用端，让调用端验证是否已经全部落地成功的，保证数据的一致性！核心处理:使用了spr...

李增田 | 1067人阅读

hadoop任务，给定数据量和处理逻辑（Sql、UDF等），如何预估计算时间与资源？有没有实际案例？

回答:首先明确下定义：计算时间是指计算机实际执行的时间，不是人等待的时间，因为等待时间依赖于有多少资源可以调度。首先我们不考虑资源问题，讨论时间的预估。执行时间依赖于执行引擎是 Spark 还是 MapReduce。Spark 任务Spark 任务的总执行时间可以看 Spark UI，以下图为例Spark 任务是分多个 Physical Stage 执行的，每个stage下有很多个task，task 的...

silenceboy | 914人阅读

计算量大需要什么服务器

问题描述:关于计算量大需要什么服务器这个问题，大家能帮我解决一下吗？

李涛 | 680人阅读

mysql数据库中，数据量很大的表，有什么优化方案么？

回答:个人的观点，这种大表的优化，不一定上来就要分库分表，因为表一旦被拆分，开发、运维的复杂度会直线上升，而大多数公司是欠缺这种能力的。所以MySQL中几百万甚至小几千万的表，先考虑做单表的优化。单表优化单表优化可以从这几个角度出发：表分区：MySQL在5.1之后才有的，可以看做是水平拆分，分区表需要在建表的需要加上分区参数，用户需要在建表的时候加上分区参数；分区表底层由多个物理子表组成，但是对于代码来...

周国辉 | 1508人阅读

为什么SQL处理数据比Java快？

回答:使用SQL处理数据时，数据会在数据库内直接进行处理，而且sql处理本身可以对sql语句做优化，按照最优的策略自动执行。使用Java处理时，需要把数据从数据库读入到Java程序内存，其中有网络处理和数据封装的操作，数据量比较大时，有一定的延迟，所以相对来说数据处理就慢一些。当然，这个只是大体示意图，实际根据业务不同会更复杂。两者侧重的点不同，有各自适合的业务领域，需要根据实际情况选用合适的方式。

stefanieliang | 1599人阅读

如何简单粗暴的优化一张数据量增长很快的千万级大表？

回答:当一张表的数据量达到千万级别的时候，任何对表的操作都得小心翼翼。核心点在于避免全表扫描、避免锁表、避免产生大量行锁。本质上是让每一次sql的执行都更快的完成，避免过长时间占用数据库连接，让连接能够迅速的释放回数据库连接池，提供更多稳定的服务。一旦产生大量的行锁甚至表锁，将会带来连接瞬间被打满、数据库资源耗尽、服务宕机的灾难性后果。所以如何避免以上问题的发生才是最重要的，绝不能等问题发生之后再去解决...

coordinate35 | 580人阅读

处理大数据量精品文章

学习Hadoop大数据基础框架

...据量早已超出 ZB（1ZB=1024EB，1EB=1024PB）级别。传统的数据处理方法是：随着数据量的加大，不断更新硬件指标，采用更加强大的CPU、更大容量的磁盘这样的措施，但现实是：数据量增大的速度远远超出了单机计算和存储能力提升...

amc 2019-08-16 13:42 评论0 收藏0
什么是大数据

...据量早已超出 ZB（1ZB=1024EB，1EB=1024PB）级别。传统的数据处理方法是：随着数据量的加大，不断更新硬件指标，采用更加强大的CPU、更大容量的磁盘这样的措施，但现实是：数据量增大的速度远远超出了单机计算和存储能力提升...

learn_shifeng 2019-08-16 13:40 评论0 收藏0
大数据拥抱云计算：让数据升华为智慧

...大数据，其实数据本身并不是有用的，必须要经过一定的处理。例如你每天跑步带个手环收集的也是数据，网上这么多网站也是数据，简称为Data，数据本身并没有什么作用，但是数据里面包含一些很重要的东西，叫做信息（Infor...

HitenDev 2019-04-29 15:49 评论0 收藏0
大数据时代数据库-云HBase架构&生态&实践

...需要做的工程量就会相对较高。引入更多的数据对于数据处理大致可归类为四个方面，分别是复杂性、灵活性、延迟和分布式，其中分布式肯定是不可少的，一旦缺少分布式就无法解决大规模问题。灵活性的意思是业务可以任...

econi 2019-06-25 18:39 评论0 收藏0
大数据分析技术与应用

...无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。二、大数据的特点 1）Volume（大量）： ...

shinezejian 2019-06-26 18:41 评论0 收藏0