资讯专栏INFORMATION COLUMN

人工智能召唤“神龙”,阿里云发布首个云上异构超算集群

source / 1679人阅读

摘要:人工智能正在召唤神龙。阿里云发布首个异构超算集群人工智能特别是深度学习,对算力的要求永无止境。除了神龙异构超算集群外,阿里云还发布了新版本可兼容加速器和小程序云。

人工智能正在召唤“神龙”。3月21日,阿里云发布业内首个公共云异构超算集群——基于弹性裸金属服务器神龙X-Dragon的SCC-GN6,集群性能接近线性增长,将深度学习训练时间缩短至分钟级,可满足无人驾驶、智能推荐、机器翻译等人工智能场景的高性能计算需求。

_

阿里云发布首个异构超算集群

人工智能特别是深度学习,对算力的要求永无止境。但如果只是堆砌芯片,没有低延时网络、高速读写能力,大规模集群无法发挥出最大的计算性能,性能损耗通常在50%左右。且算力资源并不丰富,有研究显示,到2030年中国研究人员每人平均只能拥有1-2个GPU,大多数研究将受到计算能力的严重限制。 SCC-GN6是首个基于X-Dragon架构的超算异构产品,神龙云服务器与阿里云ECS、GPU云服务器等一起,最多可达512个节点,计算性能依旧接近线性增长,提供堪比超算中心的并行计算资源。

_

神龙异构超算集群性能接近线性增长

这不仅因为支持节点数量多,更因为集成多项自研技术:软硬结合的X-Dragon架构兼具性能和灵活性,50G RDMA超算网络降低网络延时,百万级IOPS性能的ESSD块存储提供低于百微秒的读写延时,高性能并行文件系统CPFS读写吞吐达1TB/s,分布式加速框架Ali-Perseus对集群内每一颗GPU工作负载进行优化和加速。最高可以实现100%的性能提升,从而最大限度发挥芯片的计算性能。 以ImageNet竞赛的128万张图片的数据集为例,用普通计算资源训练ResNet50模型,如要达到75%的精度需要数天甚至一周的时间,而使用该神龙异构超算集群产品,模型训练可以缩短到几分钟,大大提升AI算法研发效率,加速业务创新。 阿里云智能创新产品线负责人张献涛表示:“人工智能对算力提出了新挑战,神龙异构超算集群提供了堪比超算中心的并行计算资源,用户可以随时获取高性能计算能力,更不用担心购买、搭建GPU需要耗费的时间成本。” 此外,阿里云还发布了国内首个公共云上的轻量级GPU异构计算产品——vGN5i,打破传统直通模式局限,提供比单颗物理GPU更细粒度的服务,从而让用户以更低成本、更高弹性开展业务。 作为国内第一、全球前三的云服务商,阿里云于2017年10月发布了全球首个新一代“跨界”服务器弹性裸金属服务器神龙X-Dragon,拥有接近物理机的性能以及虚拟机的灵活性,提供了新的计算资源获取方式,已经大规模服务于智能客服助手、智能翻译、无人驾驶、智能推荐等场景。 在2019阿里云峰会·北京上,阿里云还提出未来将围绕IT基础设施的云化、核心技术的互联网化和应用的数据化、智能化,持续推出符合用户需求的产品,同时致力于被生态伙伴集成,不做SaaS并帮助企业做更好的SaaS。除了神龙异构超算集群外,阿里云还发布了新版本POLARDB可兼容Oracle、SaaS加速器和小程序云。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/3332.html

相关文章

  • 阿里首次分享新产品策略,围绕“三化”升级产品体系

    摘要:月日在阿里云峰会北京上,阿里云首次分享全新的产品策略。围绕三化,阿里云当天即发布多款重磅产品,包括神龙异构超算集群新版本可兼容数据库轻量级异构计算产品实例等。此外,阿里云再次宣布云服务器块存储高速通道等降价,最高降价幅度。3月21日在阿里云峰会·北京上,阿里云首次分享全新的产品策略。阿里云智能产品管理部总经理马劲提出,未来将围绕IT基础设施的云化、核心技术的互联网化和应用的数据化、智能化这三...

    AlienZHOU 评论0 收藏0
  • 阿里渴望“被集成”背后的妥协和无奈

    摘要:阿里云渴望被集成背后妥协和无奈被集成这个说法,在阿里云智能总裁张建锋的阐述中,被表达为阿里云自己不做,而是交给大家来做。阿里云被集成思路虽然是一种无奈的妥协,但也是目前市场环境下正确的方向。3月21日,2018阿里云峰会的第一站在北京国家会议中心举行。在会上,阿里云智能事业部总裁张建锋(行癫)喊出了渴望被集成的口号,并发布了阿里巴巴小程序繁星计划。在当前的云市场环境下,阿里云此举为何?阿里云...

    baihe 评论0 收藏0
  • 解锁高性能计算与区块链应用,阿里Kubernetes服务召唤神龙

    摘要:阿里云容器服务已经发布了基于容器集群的开源区块链解决方案,利用容器技术可以在分钟之内部署完成一个生产级别安全高可用的区块链应用运行环境,帮助企业可以加速业务创新。对节点,阿里云服务会自动开启相应调度能力。 摘要: 阿里云ECS弹性裸金属服务器(神龙)已经与其容器服务全面兼容,用户可以选择在弹性裸金属服务器上直接运行容器、管控Kubernetes/Docker容器集群,如此将会获得非常出...

    KitorinZero 评论0 收藏0
  • 阿里E-HPC联合安世亚太、联科集团共建超算生态

    摘要:同时,阿里云服务也邀请到目前的两家重量级合作伙伴安世亚太和联科集团,参与技术探讨并发布了他们基于阿里云的高性能计算行业产品。 摘要: 进入中国制造2025新时代的节奏又加快了速度!阿里云是国内最大的云计算厂商,去年9月阿里云推出了首个公共云上的超算平台,可一键部署获得媲美大型超算集群环境的云上超算中心,在成本、便捷、扩展性上都有非常大的优势。 5月23日,2018云栖大会武汉峰会,阿里...

    LiuZh 评论0 收藏0
  • 阿里史上最大技术升级!正式发布飞天2.0计算操作系统

    摘要:在今天的杭州云栖大会上,阿里云公布了面向万物智能的新一代云计算操作系统飞天。飞天是阿里云自主研发的大规模云计算操作系统,可将全球数百万台服务器连成一台超级计算机,为社会提供计算能力。在今天的2018杭州·云栖大会上,阿里云公布了面向万物智能的新一代云计算操作系统——飞天2.0。官方表示,飞天2.0可满足百亿级设备的计算需求,覆盖从物联网场景随时启动的轻计算到超级计算的能力,这也是阿里云史上最...

    darryrzhong 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<