资讯专栏INFORMATION COLUMN

不以“大小”论英雄,对比IBM、AWS,谁才是Hadoop界的MVP?

jemygraw / 2199人阅读

摘要:正在逐渐成为现代数据体系结构的基石,而且我们仍会努力做出贡献回报社区,确保作为下一代数据平台的新内核能够将潜力全部发挥出来。

初创公司满怀热情地投身开源事业,积极地为开源社区贡献力量,推动Hadoop技术的更新和发展,而Amazon、IBM这样的大企业依靠Hadoop技 术不断丰富自己的产品,却很少为Hadoop社区做出贡献,这种搭“顺风车”的策略从短期来看似乎是成功的,它们通过投入最小的成本获得较大的收益,但却 失去了在Hadoop领域的话语权,最后可能受制于Cloudera和Hortonworks,以至于无法为用户提供更好的技术支持。作者Matt Asay是MongoDB的业务发展和企业战略部门副总裁,他为我们带来了详细的分析。虽然开源Hadoop供应商掌握着较好的产品,但Forrester称那些有更好策略的大企业才是最终胜利者,真的是这样吗?

大数据 的核心即Hadoop是一个用于存储和处理大数据的开源架构。多年来开源初创公司Cloudera和Hortonworks在Hadoop市场一直占有绝 对优势,而专有软件供应商Oracle、微软以及其他一些公司也想在这个市场占有一席之地,如今它们很大程度上是通过与专业的Hadoop初创公司建立伙 伴关系间接地参与市场争夺。

根据Forrester的报告,老牌技术供应商会采用出强势的产品战略,即使它们当前的Hadoop产品仍有许多有待完善的地方。让人不解的是专有供应商们却希望提供基于开源项目的稳定产品,可它们所做的贡献太少,因此也很难有太大的影响力。


Hadoop发展趋势

正 确把握Hadoop发展趋势并不难,就像Forrester说的那样,Hadoop未来的发展主要取决于不断变化的数据基础设施,而且Hadoop已经 “形成了未来灵活数据管理平台的基石”,换句话说,如果技术供应商想要跟上现代化企业步伐,它只需要一份关于Hadoop的报告。

Hadoop很有吸引力,因为它使企业能够以较少的成本存储和分析大量数据。Forrester发现,企业目前分析的数据只占到企业总数据的12%,某种程度上,是由于它们不知道该如何处理数据造成的。

Hadoop可以轻松实现大数据,因为它支持企业以更低的成本存储数据,一旦它们找到分析数据的最优办法,就可以对数据进行处理。

虽然是这样,但也可能导致一些企业将Hadoop看作“无人监管的数字垃圾填埋场”,企业正变得越来越了解Hadoop和大数据——通常情况下,企业将Hadoop的分析能力与NoSQL数据库这样的实时数据处理引擎结合在一起,用以从企业数据中收集情报,并及时采取行动。

用成熟的眼光看Hadoop,什么样的供应商值得关注?

影响力和发言权

让人不解的是,Forrester建议我们不要仅仅关注那些在Hadoop上投入大量资金的供应商。

在开源领域,成为代码源甚至要比占有源码更为重要。同样,专有软件供应商靠软件授权收费,因为它对自己知识产权保密,开源供应商的市场力量与供应商对开源项目的影响力有直接关联——也就是说放弃的知识产权越多,在开源领域的影响力就越大。

这 就是Forrester的分析在我看来并不完全正确的原因。不要只注重供应商Hadoop服务的当前状态——Hadoop初创公司很受追捧,只是因为它们 对Hadoop发展作出的贡献较大——Forrester暗示未来真正的赢家应该是IBM、AWS和Pivotal这样的大型技术公司。

出人意料的是,尽管“战略”包括了许可、定价、执行力、产品路线图和客户支持,Forrester对所有公司的社区扩展活动不作任何评论。像之前ReadWrite报道的那样,由于对Hadoop发展贡献的很少,像IBM和AWS这样的供应商很难决定Hadoop发展的方向,Hadoop创始人(Cloudera雇员)Doug Cutting断言:

@mikeolson 我不指望所有公司都为社区贡献一个项目,但那些不作出贡献的公司在Hadoop领域将没有发言权。—— Doug Cutting(@cutting)November 13,2013

同样,Hortonworks首席执行官Rob Bearden表示:社区是保证Hadoop技术精密联系的关键。

Hadoop正在逐渐成为现代数据体系结构的基石,而且我们仍会努力做出贡献回报社区,确保作为下一代数据平台的新Hadoop内核能够将潜力全部发挥出来。

搭“顺风车”的策略真的很成功吗?

追随者还是领导者

有时开源就像生活——并不完全公平。亚马逊在MySQL上投入了大量的资金,比MySQL或者Oracle(后者通过收购Sun公司得到MySQL)花的还多。同样,IBM 在Linux上花的钱比Linux领域的领导者Red Hat还多。

但Forrester的观点可能也不完全正确,例如,在“客户支持”领域,Hortonworks 的贡献可以打满分,这合情合理,因为Hortonworks为Hadoop贡献了很多代码,但Pivotal和IBM也是满分,这是不合情理的。

Forrester是觉得这些公司可以为Hadoop专有产品提供更好的客户支持吗?那些对开源项目发展没有多少贡献的供应商,它们的客户支持能力也无法和投入很多的供应商相提并论。

可以肯定,Amazon和其他公司将来会构建基于Hadoop的优质服务,但最终它们在Hadoop上将难以提供很好的客户支持,因为它们没有为Hadoop的发展作出贡献。因为,它们在项目上总是被迫成为追随者,而不是领导者。


Shaun Connolly是Hortonworks公司的战略副总裁,他写信告诉我:“制定战略要考虑到各个方面,能在产品路线图和客户支持等领域的战略上获得满分,我们感到特别自豪。

他确实应该感到自豪,这也是Hortonworks(还有Cloudera)这样的公司能够为它们客户保证优质服务的重要原因。

谁才是真正的赢家

看 来Forrester的Hadoop供应商排名与Hadoop本身关系不大,更多与Hadoop如何融入公司长期产品战略相关,比如IBM的产品战 略,Forrester写道,“IBM的产品路线图包括继续将IBM其他产品(如SPSS高级分析,高性能计算工作的负载管理、BI工具以及数据管理和建 模工具)与BigInsights Hadoop解决方案集成到一起。”

换句话说,对这些供应商而言,Hadoop只是一个很好的补充——而不是主要部分。

这一点无可厚非,毫无疑问,IBM、AWS和其他公司通过Hadoop丰富其产品会赚很多钱,但对于那些想要从Hadoop本身获得价值的公司,它们可能 更容易从那些对Hadoop发展贡献较大的企业(Cloudera和Hortonworks)那里获得好处,只有这些始终为社区做出贡献的供应商推动着 Hadoop的发展,并且为Hadoop提供更好的支持。从长远来看,只有始终站在行业最前沿,只有真正关心产品,只有为用户提供较好技术支持的供应商才 能长久的生存并发展下去,他们才是真正的赢家。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/3882.html

相关文章

  • 从数据上看:才是漫威的绝对C位

    摘要:据说此部之后,不少影迷熟知的角色演员就要离开漫威世界的荧幕了。换句话说用数据说话,谁才是漫威宇宙中着墨最多的人物我之前做了个小调查仅就我这边的采样来看,钢铁侠在国内是无法撼动的人气王。 复联4上映了!这次比美国还早了两天。当然,我还没看,不会给你们剧透,当然也不想不剧透。 这一部不仅是灭霸这一线剧情的结局,也被认为漫威第三阶段的收官之作。据说此部之后,不少影迷熟知的角色(演员)就要离开...

    RancherLabs 评论0 收藏0
  • 复仇者联盟才是绝对 C 位?Python分析9万条数据告诉你答案

    摘要:数据库文件已经超过了了。复联从开始便是漫威宇宙各路超级英雄的集结,到现在的第部,更是全英雄的汇聚。所以,灭霸出现的次数居然高于了钢铁侠。情感分析,又称为意见挖掘倾向性分析等。 showImg(https://segmentfault.com/img/remote/1460000019095022); 作者 | 罗昭成责编 | 唐小引 《复联 4》国内上映第十天,程序员的江湖里开始流传这...

    shiweifu 评论0 收藏0
  • 顶级Hadoop发行版的四个对比因素

    摘要:顶端的发行版的企业级功能三个独立的供应商的开发方法有一些明显的差异。成员声称,这将提高互操作性,并减少供应商的锁定。 通过检查较高级的Hadoop发行版的关键特征,你可以决定哪些订阅适合你的组织。虽然软件组件构成的Hadoop生态系统堆栈是开源技术,但是采用付费订阅使用其供应商的商业Hadoop平台会为企业带来许多好处。例如,订阅可以提供技术支持和培训,以及访问那些不提供给开源社区的企业功能...

    NeverSayNever 评论0 收藏0
  • 顶级Hadoop发行版的四个对比因素

    摘要:顶端的发行版的企业级功能三个独立的供应商的开发方法有一些明显的差异。成员声称,这将提高互操作性,并减少供应商的锁定。 通过检查较高级的Hadoop发行版的关键特征,你可以决定哪些订阅适合你的组织。虽然软件组件构成的Hadoop生态系统堆栈是开源技术,但是采用付费订阅使用其供应商的商业Hadoop平台会为企业带来许多好处。例如,订阅可以提供技术支持和培训,以及访问那些不提供给开源社区的企业功能...

    felix0913 评论0 收藏0
  • 大数据利器:Hadoop的十大应用场景

    摘要:基础架构管理这是一个非常基础的应用场景,用户可以用从服务器交换机以及其他的设备中收集并分析数据。安全除企业基础机构的管理之外,还可以用来处理机器生成数据以便甄别来自恶意软件或者网络中的攻击。 谁在用Hadoop?这是个问题。在大数据背景下,Apache Hadoop已经逐渐成为一种标签性,业界对于这一开源分布式技术的了解也在不断加深。但谁才是Hadoop的较大用户呢?首先想到的当然是它的发...

    yunhao 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<