资讯专栏INFORMATION COLUMN

大数据平台:Hadoop大象要起舞?

v1 / 3145人阅读

摘要:和甲骨文的战斗还真有点像两只大象之间的抗衡。那么这个大数据平台有什么本领呢根据的观点,这个大数据平台主要包含五个核心的功能容量速率和种类。

        Hadoop和大数据有点像一种原始的汤汁。至少目前没人能确定要用它去做什么,但我们也提过一些新的业务或者产品也逐渐出现,也就是雅虎的Hortonworks。
 
  最近该公司的CEO Eric Baldeschwieler在接受媒体采访中,表达了这样一个观点,即他们公司的领导预言,未来五年半个世界的数据将会出现在Hadoop中。这话一出,没准甲骨文的拉里·埃里森半夜都会爬起来。Hadoop和甲骨文的战斗还真有点像两只“大象”之间的抗衡。
 
  厂商提供了各种各样的连接器和方法,来访问和分析Hadoop存储的信息,但问题是如何利用存储于Hadoop中的信息?有一个概念是由Informatica和IBM这里提出的,就是“大数据平台。”“平台”是个很泛泛的词,总会让人想到很多问题。之前也有厂商向用户灌输这样的概念:平台化的世界,平台改变世界……更列举了诸多案例,像ZARA的平台化服装销售、万科平台模式造房子、平台玩具Fling……并将这种概念延伸到软件开发领域。那么这个大数据平台有什么本领呢?
 
  根据IBM的观点,这个“大数据平台”主要包含五个核心的功能:
  (1)容量、速率和种类。大数据不是一大堆数据,来源形式不同,可能是结构化的,也可能是非结构化的,可能进入平台的速率也不一样,都要处理。
  (2)分析。这也是IBM常说的从大数据中提炼出一种数据洞察力,而且不是单纯地将不同的数据源和各种信息转化成一种结构化的关系格式。
  (3)企业级功能。
  (4)易用的化境,这一点尤其是针对开发者。因为毕竟Hadoop和MapReduce还是不简单,如果说有一个平台可以让一般水平的开发者能够更容易地利用Hadoop,这对于企业的业务来说是不无裨益的。
  (5)集成。毕竟大数据的出现不能成为企业新的“孤岛”,为了能够避免这种情况的发生,平台就需要能够支持用一些关系数据技术等资源来集成大数据环境。
 
  不知道对于这杯原始汤汁,您有什么看法?欢迎留言。
 

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/3707.html

相关文章

  • 九头蛇与象之争,Hydra或将取代Hadoop

    摘要:仍然是一个储存大量数据的优秀平台,但很多公司面临着另一个问题,我们将数据存储到之后如何去分析数据,无论是还是都需要方便地访问中的数据,才能从中获得的价值。 Hydra(九头蛇),分布式任务处理系统,由社交标签服务提供商AddThis六年前开发,现在已得到Apache的开源许可,就像Hadoop 一样,只是还没有Hadoop那样的知名度和声势。Hydra的创造者称,该多头平台非常擅长处理一些大...

    YFan 评论0 收藏0
  • 行业厂商推出管理Hadoop集群新的可视化工具

    摘要:用于管理大数据系统的新工具以不同的方式寻求解决这一问题。施泰因巴赫表示,公司日前推出了版本许可证的开源项目,并提供了大象博士代码。的可视化管理指标新的仪表盘和可视化数据也被添加到,这是公司开发的一个开源的管理工具。 Hadoop生态系统组成部分的广度是其优势之一,但这也是一个弱点:行业开发商可以找到一个流媒体框架,适合几乎任何大数据用柱状数据存储或其他类型的架构模块,而如何将这些碎片组合在一...

    cfanr 评论0 收藏0
  • 解读:分布式计算平台Hadoop 发展现状

    摘要:雅虎开发者六年前创建了一个用于管理,存储和分析大量数据的分布式计算平台,现在大家也称云计算平台,用他儿子的玩具大象命名,并把它交给阿帕奇软件基金会。解读分布式计算平台发展现状,成立于年,也许是最成立的年轻的致力于的公司。 雅虎开发者Doug Cutting六年前创建了一个用于管理,存储和分析大量数据的分布式计算平台Hadoop,现在大家也称云计算平台,用他儿子的玩具大象命名,并把它交 给阿...

    fai1017 评论0 收藏0
  • 盘点Hadoop生态圈:13个让象飞起来的开源工具

    摘要:与相同的元数据语法驱动程序和用户接口,可以直接在或上提供快速交互式查询。目前支持的组件包括及。 Hadoop是由Apache基金会开发的一个大数据分布式系统基础架构,最早版本是2003年原Yahoo! Doug Cutting根据Google发布的学术论文研究而来。用户可以在不了解分布式底层细节的情况下,轻松地在Hadoop上开发和运行处理海量数据的应用 程序。低成本、高可靠、高扩展、高有...

    syoya 评论0 收藏0
  • 飞起来的象-Hadoop从离线到在线

    摘要:业内哪些事情值得关注大数据解决方案提供商上市。加密过程是端到端的,这意味着数据只能在应用程序解密。计划未来支持部署在多机房,实现跨机房容灾,零丢失率,低延时。目前支持此种方式的数据类型有。 时代在变迁,市场在变化,周边的软硬件环境也突飞猛进般的发展,同时企业的业务需求也不断升级,从规模到成本都有较高的要求,这刺激Hadoop生态圈的变革。据AMR研究显示,到2020年Hadoop将拥有502...

    Rango 评论0 收藏0

发表评论

0条评论

v1

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<