大数据量SEARCH AGGREGATION

首页/精选主题/

大数据量

大数据平台

...rm(简称 USDP),是 UCloud 推出的云上智能化、轻量级的大数据基础服务平台,能够帮您快速构建起大数据的分析处理能力。 USDP 构建于 UCloud 的云服务上,无缝集成云端 IaaS 资源能力,通过自研的 USDP Manager 管理工具,支持用户...

大数据量问答精选

计算量大需要什么服务器

问题描述:关于计算量大需要什么服务器这个问题,大家能帮我解决一下吗?

李涛 | 669人阅读

mysql数据库中,数据量很大的表,有什么优化方案么?

回答:个人的观点,这种大表的优化,不一定上来就要分库分表,因为表一旦被拆分,开发、运维的复杂度会直线上升,而大多数公司是欠缺这种能力的。所以MySQL中几百万甚至小几千万的表,先考虑做单表的优化。单表优化单表优化可以从这几个角度出发:表分区:MySQL在5.1之后才有的,可以看做是水平拆分,分区表需要在建表的需要加上分区参数,用户需要在建表的时候加上分区参数;分区表底层由多个物理子表组成,但是对于代码来...

周国辉 | 1482人阅读

如何简单粗暴的优化一张数据量增长很快的千万级大表?

回答:当一张表的数据量达到千万级别的时候,任何对表的操作都得小心翼翼。核心点在于避免全表扫描、避免锁表、避免产生大量行锁。本质上是让每一次sql的执行都更快的完成,避免过长时间占用数据库连接,让连接能够迅速的释放回数据库连接池,提供更多稳定的服务。一旦产生大量的行锁甚至表锁,将会带来连接瞬间被打满、数据库资源耗尽、服务宕机的灾难性后果。所以如何避免以上问题的发生才是最重要的,绝不能等问题发生之后再去解决...

coordinate35 | 552人阅读

你处理过的最大的数据量是多少?你是如何处理的?

回答:我是做JAVA后台开发的,目前为止最多处理过每天600万左右的数据!数据不算特别多,但是也算是经历过焦头烂额,下面浅谈下自己和团队怎么做的?后台架构:前置部门:负责接收别的公司推过来的数据,因为每天的数据量较大,且分布不均,使用十分钟推送一次报文的方式,使用batch框架进行数据落地,把落地成功的数据某个字段返回给调用端,让调用端验证是否已经全部落地成功的,保证数据的一致性!核心处理:使用了spr...

李增田 | 1058人阅读

mysql表数据量太大,达到了1亿多条数据,除了分库分表之外,还有没有其他的解决方式?

回答:mysql在常规配置下,一般只能承受2000万的数据量(同时读写,且表中有大文本字段,单台服务器)。现在超过1亿,并不断增加的情况下,建议如下处理:1 分表。可以按时间,或按一定的规则拆分,做到查询某一条数据库,尽量在一个子表中即可。这是最有效的方法2 读写分离。尤其是写入,放在新表中,定期进行同步。如果其中记录不断有update,最好将写的数据放在 redis中,定期同步3 表的大文本字段分离出...

zhou_you | 9265人阅读

hadoop任务,给定数据量和处理逻辑(Sql、UDF等),如何预估计算时间与资源?有没有实际案例?

回答:首先明确下定义:计算时间是指计算机实际执行的时间,不是人等待的时间,因为等待时间依赖于有多少资源可以调度。首先我们不考虑资源问题,讨论时间的预估。执行时间依赖于执行引擎是 Spark 还是 MapReduce。Spark 任务Spark 任务的总执行时间可以看 Spark UI,以下图为例Spark 任务是分多个 Physical Stage 执行的,每个stage下有很多个task,task 的...

silenceboy | 905人阅读

大数据量精品文章

  • TiDB 在零氪科技(LinkDoc)数据医疗系统的实践

    公司介绍 零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托...

    Mr_houzi 评论0 收藏0
  • TiDB 在零氪科技(LinkDoc)数据医疗系统的实践

    公司介绍 零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托...

    nidaye 评论0 收藏0
  • TiDB 在零氪科技(LinkDoc)数据医疗系统的实践

    公司介绍 零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托...

    wanglu1209 评论0 收藏0
  • 试着解释数据

    ...总结留底,所以做了些修改,形成了这篇文章。 我做大数据其实时间并不长,对大数据的理解也还处于很粗浅的阶段,欢迎大家讨论。 大数据这事其实有两层意思:一层是单纯从业务上说,到底如何收集并有效利用数据做决...

    roadtogeek 评论0 收藏0
  • 学习Hadoop数据基础框架

    什么是大数据?进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约...

    amc 评论0 收藏0
  • 给Hadoop一个支点:撬动数据

    大数据大概是继云计算之后,最热门的科技名词了。一些科技厂商不约而同,纷纷打出大数据口号,情况就像云计算热潮一样。那么大数据到底是怎么回事? 大数据照字面翻译,就是大数据,而这个大,最起码包含3种意思:...

    LoftySoul 评论0 收藏0
  • DataPipeline在数据平台的数据流实践

    文 | 吕鹏 DataPipeline架构师 进入大数据时代,实时作业有着越来越重要的地位。本文将从以下几个部分进行讲解DataPipeline在大数据平台的实时数据流实践。 一、企业级数据面临的主要问题和挑战 1.数据量不断攀升 随着互联网...

    nifhlheimr 评论0 收藏0
  • 数据时代数据库-云HBase架构&生态&实践

    摘要: 2018第九届中国数据库技术大会,阿里云高级技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBas...

    nanchen2251 评论0 收藏0
  • 数据时代数据库-云HBase架构&生态&实践

    摘要: 2018第九届中国数据库技术大会,阿里云高级技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBas...

    econi 评论0 收藏0
  • 数据时代数据库-云HBase架构&生态&实践

    摘要: 2018第九届中国数据库技术大会,阿里云高级技术专家、架构师封神(曹龙)带来题为大数据时代数据库-云HBase架构&生态&实践的演讲。主要内容有三个方面:首先介绍了业务挑战带来的架构演进,其次分析了ApsaraDB HBas...

    weknow619 评论0 收藏0
  • Hadoop数据平台撑起Big Data挑战

    ...g Data到底是怎么回事?   Big Data照字面翻译,就是大数据,而这个大,最起码包含3种意思:大量的数据存储、很大的数据、很大的数据库。所以就中文译名来看,不论是翻成大数据或海量数据,其实都只能道出Bi...

    1fe1se 评论0 收藏0
  • 第四范式戴文渊:机器学习教科书的 7 经典问题

    ...实际情况是,你很可能已经在走弯路。 科技发展很快,数据在指数级增长,环境也在指数级改变,因此很多时候教科书会跟不上时代的发展。有时,即便是写教科书的人,也不见得都明白结论背后的所以然,因此有些结论...

    DevTTL 评论0 收藏0
  • 第四范式戴文渊:机器学习教科书的 7 经典问题

    ...实际情况是,你很可能已经在走弯路。 科技发展很快,数据在指数级增长,环境也在指数级改变,因此很多时候教科书会跟不上时代的发展。有时,即便是写教科书的人,也不见得都明白结论背后的所以然,因此有些结论...

    silencezwm 评论0 收藏0
  • TiDB 助力卡思数据视频数据业务创新

    作者:刘广信,火星文化技术经理 卡思数据是国内领先的视频全网数据开放平台,依托领先的数据挖掘与分析能力,为视频内容创作者在节目创作和用户运营方面提供数据支持,为广告主的广告投放提供数据参考和效果监测...

    Ocean 评论0 收藏0
  • TiDB 助力卡思数据视频数据业务创新

    作者:刘广信,火星文化技术经理 卡思数据是国内领先的视频全网数据开放平台,依托领先的数据挖掘与分析能力,为视频内容创作者在节目创作和用户运营方面提供数据支持,为广告主的广告投放提供数据参考和效果监测...

    hearaway 评论0 收藏0

推荐文章

相关产品

<