资讯专栏INFORMATION COLUMN

Google停用MapReduce,发布Cloud Dataflow

summerpxy / 371人阅读

摘要:但是近日,这项技术已经不能处理谷歌想要分析的大量数据。在展示会上也宣布谷歌云平台上其他一些新的服务是一个,它使应用程序能够在云中或其他地方保存单个用户的数据而不需要任何服务器端的编码。


 Google已经停用自己研发的并部署在服务器上分析数据的开源系统MapReduce,转而支持一个新的超大规模云分析系统Cloud Dataflow。 

MapReduce一直是服务器集群上做并行分布式计算的一个非常受欢迎的基础架构和编程模型。它是被广泛部署并已经成为很多公司商业产品的大数据基础架构平台Hadoop的基础。 

但是近日,这项技术已经不能处理谷歌想要分析的大量数据。然而,技术基础设施部高级副总裁UrsHölzle表示,一旦数据规模达到数PB级字节,处理起来将变得非常困难。 

“我们将不再使用MapReduce。”Hölzle在周三于旧金山举行的谷歌I/O大会上发表主题演讲时表示,公司已经在几年前停止使用这个系统,更多大会内容可点击2014谷歌I/O上的Google Cloud Platform和Cloud Dataflow。

Cloud DataFlow,将作为一项服务提供给使用它们云服务的开发者,这些服务并没有MapReduce的扩展限制。 

“Cloud Dataflow是这近十年分析经验的成果。”Hölzle说,它将会比现存的所有的系统运行的更快,更易扩展。 

这是一个完全托管服务,它可以自动优化、部署、管理以及扩展。它使开发人员对批处理和流媒体服务能够使用统一编程轻松地创建复杂的管道,他表示。

所有这些特点,谷歌认为在MapReduce上无法完成:很难迅速获取数据,不能进行批处理和流处理,而且经常需要部署和运行MapReduce集群。

Hölzle在展示会上也宣布谷歌云平台上其他一些新的服务:

 

  • Cloud Save是一个API,它使应用程序能够在云中或其他地方保存单个用户的数据而不需要任何服务器端的编码。 提供App Engine的PaaS用户和提供Compute Engine的用户都可以利用这特征构建App。
  • Cloud Debugging 简化了筛选出部署在云端的多台服务器中的软件缺陷的过程。
  • Cloud Tracing 提供了不同群体(数据库服务调用,例如等待时间)的延时统计数据以及分析报告。
  • Cloud Monitoring 是一款与Stackdriver(谷歌5月份收购的一个云监控初创公司)集成的智能监控系统。该系统监控云基础设施资源,如磁盘和虚拟机,还有一些为谷歌提供服务的服务等级以及十几个非谷歌提供的开源软件包。

 

原文链接:Google Dumps MapReduce in Favor of New Hyper-Scale Analytics System 

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/4091.html

相关文章

  • Flink 从0到1学习—— 分享四本 Flink 国外的书和二十多篇 Paper 论文

    摘要:另外,将机制发扬光大,对有着非常好的支持。系统也注意到并讨论了和的问题。总结本文分享了四本相关的书籍和一份领域相关的论文列表篇,涉及的设计,实现,故障恢复,弹性扩展等各方面。 前言 之前也分享了不少自己的文章,但是对于 Flink 来说,还是有不少新入门的朋友,这里给大家分享点 Flink 相关的资料(国外数据 pdf 和流处理相关的 Paper),期望可以帮你更好的理解 Flink。...

    jollywing 评论0 收藏0
  • 职业转型的终极指南:从新手到专业的机器学习工程师

    摘要:作者微信号微信公众号简书地址最近机器学习工程师已经成为了一个非常热门的岗位,很多的工程师都想转行到这个岗位。本文根据上面的课程,列了一个从新手到专业工程师的学习计划,提供给大家学习。 作者:chen_h微信号 & QQ:862251340微信公众号:coderpai简书地址:http://www.jianshu.com/p/32b2... 最近机器学习工程师已经成为了一个非常热门的岗...

    XanaHopper 评论0 收藏0
  • Spring Boot Cloud CLI - 快速上手

    摘要:是什么官方是这样描述的翻译之后为提供了命令行功能。您还可以轻松地执行加密和解密等操作,以支持具有机密配置值的配置客户机。可用于从命令行运行,等常用服务。列出您可以执行的可用服务,并仅启动一组默认服务。 导读 在日常开发与测试中有一些Spring Cloud 的相关的组件如 eureka、configserver、zipkin、hystrixdashboard等相对来说不容易发生变动,这...

    lindroid 评论0 收藏0
  • 2012:云计算的春天

    回顾2012,更多开放,更多协作,更多机会产生。从来没有一项服务会将几乎所有IT、互联网、通信技术整合在一起,没有合作、开放的心态就没有云计算。接下来,将从IaaS、NoSQL与NewSQL、数据中心、大数据、安全这几个方面对过去一年作出总结。IaaS——群雄追赶AWS谈到IaaS,Google和AWS是公认的业界最强。AWS是全球将IaaS这个business运营的较好的公司,除了技术领先,还要...

    Vicky 评论0 收藏0
  • 谷歌发布Kubernetes v1.0,容器生态前景明媚

    摘要:与此同时,谷歌联合基金会及其他合作伙伴共同成立了基金会,并将作为首个编入管理体系的开源项目,助力容器技术生态的发展进步。年月谷歌宣布开源。年月容器引擎启动,谷歌宣布中支持容器及服务,并以为构架。 7月22日Google正式对外发布 Kubernetes v 1.0,意味着这个开源容器编排系统可以正式在生产环境使用。与此同时,谷歌联合linux基金会及其他合作伙伴共同成立了CNCF基金会...

    Mertens 评论0 收藏0

发表评论

0条评论

summerpxy

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<