文章库ARTICLE COLUMN

  • UCloud UHadoop:消除计算存储的木桶效应,大幅降低运营成本

    UCloud UHadoop:消除计算存储的木桶效应,大幅降低运营成本

    摘要:微软雅黑宋体近日,通过提供独立的存储集群独立的元数据管理和独立的计算集群,实现了兼顾灵活性与稳定性的存储计算分离架构,帮助用户更好的提升资源利用率,增加大数据业务部署的灵活性,同时降低运营成本。近日,UCloud UHadoop 通过提供独立的HDFS...

    developerworksdeveloperworks 评论0 收藏0
  • 云计算与Hadoop11年来相爱相杀!

    云计算与Hadoop11年来相爱相杀!

    同时诞生于2006年,十年间云计算革了架构的命,那Hadoop呢?Doug Cutting,在外界看来至少有两个称谓:作为技术大牛他是Hadoop之父,作为商业领袖他是Cloudera首席架构师。近日,Doug Cutting来到北京,也因此接受了科技茱比莉的采访。过去的十年毫无疑问属...

    GodtoyGodtoy 评论0 收藏0
  • 如何根据数据冷热程度分层存储,让HDFS更高效?

    如何根据数据冷热程度分层存储,让HDFS更高效?

    摘要:如何根据数据冷热程度对存储系统进行优化是一个亟待解决的问题。纠删码传统数据采用三副本机制保证数据的可靠性,即每存储数据,实际在集群各节点上占用的数据达到,额外开销为。根据热度和规则,生成具体的任务。 陶捷中国移动苏州研发中心高级软件开...

    ClectClect 评论0 收藏0
  • 最常见的7 种 Hadoop 和 Spark 项目案例

    最常见的7 种 Hadoop 和 Spark 项目案例

    摘要:具体的实施可能有所不同,但根据我的经验,它们是最常见的七种项目。这通常意味着很多容器包。这些项目通常与号或号重合,但增加了各自的范围和特点。,这些几乎都是和项目。几年前我已经实施了这些项目中的部分案例,使用的是其它技术。 如果您的 Hado...

    yeyan1996yeyan1996 评论0 收藏0
  • Apache Hadoop 3.0.0 GA版正式发布,可以部署到线上

    Apache Hadoop 3.0.0 GA版正式发布,可以部署到线上

    摘要:支持纠删码与副本相比纠删码是一种更节省空间的数据持久化存储方法。因为纠删码额外开销主要是在重建和执行远程读,它传统用于存储冷数据,即不经常访问的数据。当部署这个新特性时用户应该考虑纠删码的网络和开销。 今天凌晨 Apache Hadoop 3.0.0 GA ...

    3fuyu3fuyu 评论0 收藏0
  • 原创翻译 | Hadoop和企业信息管理:利用大数据的解决方案

    原创翻译 | Hadoop和企业信息管理:利用大数据的解决方案

    摘要:年看起来是在开源开发和更多的商业选择方面在企业层面上,由于企业信息管理仍然需要更多改进的大数据解决方案。是支持大数据的技术的极好解决方案,可以为业务用户提供真正的好处。到目前为止,许多想要管理多结构的大数据的组织可能会依赖来交付理想的...

    YacaToyYacaToy 评论0 收藏0
  • 打赢数据安全攻坚战,从Hadoop-security治理说起!

    打赢数据安全攻坚战,从Hadoop-security治理说起!

    摘要:整个集群的所有数据,或者至少是公司级的敏感数据,需要加密应该有统一的密钥管理中心管理着每一类数据的访问密钥。全数据中心的所有数据都是加密的,而且密钥管理中心做到了高可用。服务器端网络不安全,被攻破,被拖库。 作者介绍汪涉洋,来自美国视...

    CoXieCoXie 评论0 收藏0
  • HDFS 副本存放磁盘选择策略详解

    HDFS 副本存放磁盘选择策略详解

    摘要:通过参数来设置,这个参数目前支持两种磁盘选择策略如果想及时了解或者相关的文章,欢迎关注微信公共帐号参数的默认值是。下面对内置的两种磁盘选择策略进行详细的介绍。磁盘选择策略可用空间磁盘选择策略是从开始引入的详情参见。 在 HDFS 中,DataNod...

    legendmohelegendmohe 评论0 收藏0
  • Apache Hadoop 3.1.0 正式发布,原生支持GPU和FPGA

    Apache Hadoop 3.1.0 正式发布,原生支持GPU和FPGA

    摘要:月日,正式发布了,是年系列的第一个小版本,并且带来了许多增强功能。不过需要注意的是,这个版本并不推荐在生产环境下使用,如果需要在正式环境下使用,请等待或版本。更多的详情请参见官方 4月6日,Apache Hadoop 3.1.0 正式发布了,Apache Hadoop 3...

    DrummorDrummor 评论0 收藏0
  • 在 OpenStack 上部署 Hadoop

    在 OpenStack 上部署 Hadoop

    摘要:看一个用例场景大量的数据存储在关系数据库管理系统环境中。当数据集越来越大时,关系数据库管理系统表现不佳。可在几分钟内部署集群。像其他服务一样,服务可以通过强大的和仪表板进行管理。编排即服务用于配置和编排数据处理集群的部署。 OpenStack ...

    luffyZhluffyZh 评论0 收藏0
  • Hadoop和大数据最炫目的60款顶级开源工具

    Hadoop和大数据最炫目的60款顶级开源工具

    摘要:说到处理大数据的工具,普通的开源解决方案尤其是堪称中流砥柱。这回我们推出了的较高级开源大数据工具排行榜。它还含有用于分析和显示数据的工具。它是大数据库套件的一部分。 说到处理大数据的工具,普通的开源解决方案(尤其是Apache Hadoop)堪称中...

    LancerCometLancerComet 评论0 收藏0
  • 一文理解 Apache Hadoop 机架感知

    一文理解 Apache Hadoop 机架感知

    摘要:机架内的机器之间的网络速度通常都会高于跨机架机器之间的网络速度,并且机架之间机器的网络通信通常受到上层交换机间网络带宽的限制。第二个副本放置在与第一个节点不同的机架中的中随机选择。配置默认情况下,的机架感知是没有被启用的。 背景分布式...

    xuxuelixuxueli 评论0 收藏0
  • Hadoop真的要死了吗?

    Hadoop真的要死了吗?

    摘要:但并非所有的反应都是积极正向的。产品和营销高级副总裁在上发布的一篇文章中指出,大数据的中心已经从转移到了云端,在对象存储系统如亚马逊微软和中存储数据比在中便宜了五倍。未来将会入驻,并接管其中的一大部分内容。 10 月 3 日,Hortonworks 宣...

    _ang_ang 评论0 收藏0
  • 一文理解 Apache Hadoop 机架感知

    一文理解 Apache Hadoop 机架感知

    摘要:机架内的机器之间的网络速度通常都会高于跨机架机器之间的网络速度,并且机架之间机器的网络通信通常受到上层交换机间网络带宽的限制。第二个副本放置在与第一个节点不同的机架中的中随机选择。配置默认情况下,的机架感知是没有被启用的。 背景分布式...

    YumenokanataYumenokanata 评论0 收藏0
  • 通过BulkLoad快速将海量数据导入到Hbase

    通过BulkLoad快速将海量数据导入到Hbase

    摘要:我们很自然地想到将数据一条条插入到中,或者通过方式等。本文将针对这个问题介绍如何通过的方法来快速将海量数据导入到中。这一步是最简单的,通常需要使用更为人所熟知是工具,将文件在上的位置传递给它,它就会利用将数据导入到相应的区域。 在第一...

    CollinPengCollinPeng 评论0 收藏0
  • HBase在人工智能场景的使用

    HBase在人工智能场景的使用

    摘要:近几年来,人工智能逐渐火热起来,特别是和大数据一起结合使用。为了更好的介绍在人工智能场景下的使用,下面以某人工智能行业的客户案例进行分析如何利用设计出一个快速查找人脸特征的系统。方案之前业务数据量比较小的情况使用的存储主要为以及对象存...

    chavesguchavesgu 评论0 收藏0
  • Strata+Hadoop World 北京首届会议

    Strata+Hadoop World 北京首届会议

    摘要:即将于月号在北京举行。是不容错过的数据盛会,是全球最顶尖的数据系列会议聚焦在大数据机器学习普适计算和分析学以及大数据可以带来的商机。关于大数据的知识和技能的广度和深度是卓越的,您将获得独一无二的学习机会。 Strata +Hadoop World 即将于8...

    lushanlushan 评论0 收藏0
  • 如何保证Hadoop数据湖不变成“数据洪水”

    如何保证Hadoop数据湖不变成“数据洪水”

    摘要:但是如何保证数据湖不像南方水灾一样泛滥,依然是一个耐人寻味的话题。而且数据湖具备数据库的大部分特质,可以提供数据查询结构化数据处理报告等业务。如何保证数据湖不变成数据洪水数据洪一触即发但是,问题也就发生在这里。 数据湖的提出距今已经有...

    frontoldmanfrontoldman 评论0 收藏0
  • 如何在Hadoop 2.0上实现深度学习?

    如何在Hadoop 2.0上实现深度学习?

    摘要:下面我们就将一起探讨如何将深度学习最前沿的机器学习框架部署到的集群中。更进一步,可以利用来将任何适合的机器学习算法进行分布计算。能够利用通用的集群平台将极大的利于在大数据上运行可扩展的机器学习算法。 位于波士顿的数据科学团队正在利用前...

    JowayYoungJowayYoung 评论0 收藏0
  • 顶级Hadoop发行版的四个对比因素

    顶级Hadoop发行版的四个对比因素

    摘要:顶端的发行版的企业级功能三个独立的供应商的开发方法有一些明显的差异。成员声称,这将提高互操作性,并减少供应商的锁定。 通过检查较高级的Hadoop发行版的关键特征,你可以决定哪些订阅适合你的组织。虽然软件组件构成的Hadoop生态系统堆栈是开源技...

    NeverSayNeverNeverSayNever 评论0 收藏0
  • 想要从大数据中获益?请先做好Hadoop管理

    想要从大数据中获益?请先做好Hadoop管理

    摘要:公司的团队在对数据湖泊进行性能管理时,考虑的十分周全。和其他演讲者认为,对于那些试图从大数据中获益的企业来说,有效的管理是必须的。为了在监测数据上完成更高级的聚合,该公司还建立了一个本地管理控制台,称为。 Hadoop管理正在成为大数据用户...

    BmobBmob 评论0 收藏0
  • Hadoop十年 推动数据驱动型分析快速发展

    Hadoop十年 推动数据驱动型分析快速发展

    摘要:为了纪念这些事件,大数据供应商的高管们为该分布式处理框架过去十年中在数据管理和分析处理上的影响给予了高度的赞誉。是该项技术的联合创造者,他现在是分销商的首席架构师,他表示,架构已经可以让数据驱动业务,而且这是发生在企业核心的。 Hadoop...

    CristalvenCristalven 评论0 收藏0
  • 优步在Hadoop上做增量处理的案例

    优步在Hadoop上做增量处理的案例

    摘要:为了履行这一承诺,优步依赖于在每个层面做出数据驱动的决策。完整性和延迟之间的权衡在计算时,随着我们在流式处理增量处理和批处理之间变换,我们面临着相同的根本权衡。 优步的任务是提供对每个人来说,在任何地方都可以获得像自来水一样可靠的出...

    jsdtjsdt 评论0 收藏0
  • Hadoop namenode高可用性分析:QJM核心源代码解读

    Hadoop namenode高可用性分析:QJM核心源代码解读

    摘要:但有了副本就引入了新的问题,多个副本之间的一致性怎么保证,这是分布式存储必须解决的问题。关于作者彭荣新,上海欧电云信息科技有限公司架构师,个人对分布式存储,并发等底层相关的技术比较感兴趣,一直在学习的路上。 背景介绍HDFS namenode 在接...

    琛h。琛h。 评论0 收藏0
  • 到2021年,Hadoop大数据分析市场产值将达406.9亿美元

    到2021年,Hadoop大数据分析市场产值将达406.9亿美元

    摘要:据市场研究咨询公司新发布的一份市场研究报告声称,大数据市场产值预计会从年的亿美元猛增至年的亿美元,年至年的年复合增长率将高达。从市场组成部分来看,大数据分析市场被分为解决方案和服务这两大块。解决方案这部分预计会在年至年引领大数据分析市...

    shevyshevy 评论0 收藏0
<