大数据量管理SEARCH AGGREGATION

首页/精选主题/

大数据量管理

大数据平台

...rm(简称 USDP),是 UCloud 推出的云上智能化、轻量级的大数据基础服务平台,能够帮您快速构建起大数据的分析处理能力。 USDP 构建于 UCloud 的云服务上,无缝集成云端 IaaS 资源能力,通过自研的 USDP Manager 管理工具,支持用户...

大数据量管理问答精选

计算量大需要什么服务器

问题描述:关于计算量大需要什么服务器这个问题,大家能帮我解决一下吗?

李涛 | 679人阅读

mysql数据库中,数据量很大的表,有什么优化方案么?

回答:个人的观点,这种大表的优化,不一定上来就要分库分表,因为表一旦被拆分,开发、运维的复杂度会直线上升,而大多数公司是欠缺这种能力的。所以MySQL中几百万甚至小几千万的表,先考虑做单表的优化。单表优化单表优化可以从这几个角度出发:表分区:MySQL在5.1之后才有的,可以看做是水平拆分,分区表需要在建表的需要加上分区参数,用户需要在建表的时候加上分区参数;分区表底层由多个物理子表组成,但是对于代码来...

周国辉 | 1506人阅读

如何简单粗暴的优化一张数据量增长很快的千万级大表?

回答:当一张表的数据量达到千万级别的时候,任何对表的操作都得小心翼翼。核心点在于避免全表扫描、避免锁表、避免产生大量行锁。本质上是让每一次sql的执行都更快的完成,避免过长时间占用数据库连接,让连接能够迅速的释放回数据库连接池,提供更多稳定的服务。一旦产生大量的行锁甚至表锁,将会带来连接瞬间被打满、数据库资源耗尽、服务宕机的灾难性后果。所以如何避免以上问题的发生才是最重要的,绝不能等问题发生之后再去解决...

coordinate35 | 579人阅读

你处理过的最大的数据量是多少?你是如何处理的?

回答:我是做JAVA后台开发的,目前为止最多处理过每天600万左右的数据!数据不算特别多,但是也算是经历过焦头烂额,下面浅谈下自己和团队怎么做的?后台架构:前置部门:负责接收别的公司推过来的数据,因为每天的数据量较大,且分布不均,使用十分钟推送一次报文的方式,使用batch框架进行数据落地,把落地成功的数据某个字段返回给调用端,让调用端验证是否已经全部落地成功的,保证数据的一致性!核心处理:使用了spr...

李增田 | 1066人阅读

mysql表数据量太大,达到了1亿多条数据,除了分库分表之外,还有没有其他的解决方式?

回答:mysql在常规配置下,一般只能承受2000万的数据量(同时读写,且表中有大文本字段,单台服务器)。现在超过1亿,并不断增加的情况下,建议如下处理:1 分表。可以按时间,或按一定的规则拆分,做到查询某一条数据库,尽量在一个子表中即可。这是最有效的方法2 读写分离。尤其是写入,放在新表中,定期进行同步。如果其中记录不断有update,最好将写的数据放在 redis中,定期同步3 表的大文本字段分离出...

zhou_you | 9783人阅读

hadoop任务,给定数据量和处理逻辑(Sql、UDF等),如何预估计算时间与资源?有没有实际案例?

回答:首先明确下定义:计算时间是指计算机实际执行的时间,不是人等待的时间,因为等待时间依赖于有多少资源可以调度。首先我们不考虑资源问题,讨论时间的预估。执行时间依赖于执行引擎是 Spark 还是 MapReduce。Spark 任务Spark 任务的总执行时间可以看 Spark UI,以下图为例Spark 任务是分多个 Physical Stage 执行的,每个stage下有很多个task,task 的...

silenceboy | 914人阅读

大数据量管理精品文章

  • TiDB 在零氪科技(LinkDoc)数据医疗系统的实践

    公司介绍 零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托...

    Mr_houzi 评论0 收藏0
  • TiDB 在零氪科技(LinkDoc)数据医疗系统的实践

    公司介绍 零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托...

    nidaye 评论0 收藏0
  • TiDB 在零氪科技(LinkDoc)数据医疗系统的实践

    公司介绍 零氪科技作为全球领先的人工智能与医疗大数据平台,拥有国内最大规模、体量的医疗大数据资源库和最具优势的技术支撑服务体系。多年来,零氪科技凭借在医疗大数据整合、处理和分析上的核心技术优势,依托...

    wanglu1209 评论0 收藏0
  • 学习Hadoop数据基础框架

    什么是大数据?进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大约...

    amc 评论0 收藏0
  • 什么是数据

    一、什么是大数据进入本世纪以来,尤其是2010年之后,随着互联网特别是移动互联网的发展,数据的增长呈爆炸趋势,已经很难估计全世界的电子设备中存储的数据到底有多少,描述数据系统的数据量的计量单位从MB(1MB大...

    learn_shifeng 评论0 收藏0
  • TiDB 在摩拜单车在线数据业务的应用和实践

    ...享单车运营平台和移动物联网平台。摩拜每天产生的骑行数据超过 30TB,在全球拥有最为全面的骑行大数据,飞速增长的业务使摩拜面临数据库扩展与运维的巨大挑战。 面对飞速增长的并发数与数据量,单机数据库终将因无法支...

    qingshanli1988 评论0 收藏0
  • TiDB 在摩拜单车在线数据业务的应用和实践

    ...享单车运营平台和移动物联网平台。摩拜每天产生的骑行数据超过 30TB,在全球拥有最为全面的骑行大数据,飞速增长的业务使摩拜面临数据库扩展与运维的巨大挑战。 面对飞速增长的并发数与数据量,单机数据库终将因无法支...

    guqiu 评论0 收藏0
  • 为减少用户电话排队,阿里研发了智能客服调度系统

    ...发生到调度生效超过十几分钟很正常; 2)不精准:缺乏数据指导,统筹优化能力弱。举个例子,A技能组排队时现场管理员想将A技能组的流量切一些到B里,切多少,分给谁,可能都是拍脑袋决定,决策结果也无法沉淀; 3)手...

    tinysun1234 评论0 收藏0
  • hadoop集群管理系统搭建规划说明

    ...常状态是从节点和计算节点一样工作。这种架构设计保证数据完整性。首先我们保证每台计算节点上分别有一个DataNode节点和NodeManager节点。因为都是计算节点,真正干活的。在数量上我们要保证。那么NameNode和ResourceManager是两个...

    ThreeWords 评论0 收藏0
  • 为减少用户电话排队,阿里研发了智能客服调度系统

    ...发生到调度生效超过十几分钟很正常; 2)不精准:缺乏数据指导,统筹优化能力弱。举个例子,A技能组排队时现场管理员想将A技能组的流量切一些到B里,切多少,分给谁,可能都是拍脑袋决定,决策结果也无法沉淀; 3)手...

    eechen 评论0 收藏0
  • 如何正确看待数据与云计算技术?

    ...淫溪谷,盛怒于土囊之口,……DT时代,未来已来——数据大爆炸首先要明白大家为何从前几年开始谈大数据了?这是一个基本问题,包含着对当下数据现实的基本认识。一个不可忽视的事实是,随着网络和信息技术的不...

    Jrain 评论0 收藏0
  • 海航生态科技舆情数据平台容器化改造

    ...ker(账号:dockerone),作者为海航生态科技技术研究院大数据开发工程师高颜。 文章介绍了海航生态科技舆情大数据平台的容器化改造经验,包括初期技术架构、应用容器化、架构迁移、持续发布与部署。 海航舆情监控系统能...

    idealcn 评论0 收藏0
  • 巨杉应用案例:数据司法查询平台

    ...过程中,侦查机关到商业银行开展查询工作时却因为历史数据查询上的困难,导致查询工作效率低下。 对于历史数据而言,超过三至五年的数据,银行会采用离线存储的方式将数据归档至磁带库或光盘库。当侦查机关向银行提出...

    zhichangterry 评论0 收藏0
  • ZB 级的数据探索与应用实践「附 PPT」

    据报告显示到 2025 年,全球将产生 180ZB 的数据。这些海量的数据正是企业进行数字化转型的核心生产因素,然而真正被有效存储、使用和分析的数据不到百分之十。如何从 ZB 级的数据中寻找分析有价值的信息并回馈到业务发展...

    YFan 评论0 收藏0
  • 58同城技术委员会执行主席沈剑:好的架构是进化来的,不是设计来的

    ...是几次的访问。此时网站架构的特点:请求量是比较低,数据量比较小,代码量也比较小。可能找几个工程师,很容易就做一个这样的站点,根本没什么「架构」可言。 其实,这也是很多创业公司初期面临的问题,最开始58同城...

    didikee 评论0 收藏0

推荐文章

相关产品

<