资讯专栏INFORMATION COLUMN

人工智能召唤“神龙”,阿里云发布首个云上异构超算集群

source / 1373人阅读

摘要:人工智能正在召唤神龙。阿里云发布首个异构超算集群人工智能特别是深度学习,对算力的要求永无止境。除了神龙异构超算集群外,阿里云还发布了新版本可兼容加速器和小程序云。

人工智能正在召唤“神龙”。3月21日,阿里云发布业内首个公共云异构超算集群——基于弹性裸金属服务器神龙X-Dragon的SCC-GN6,集群性能接近线性增长,将深度学习训练时间缩短至分钟级,可满足无人驾驶、智能推荐、机器翻译等人工智能场景的高性能计算需求。

_

阿里云发布首个异构超算集群

人工智能特别是深度学习,对算力的要求永无止境。但如果只是堆砌芯片,没有低延时网络、高速读写能力,大规模集群无法发挥出最大的计算性能,性能损耗通常在50%左右。且算力资源并不丰富,有研究显示,到2030年中国研究人员每人平均只能拥有1-2个GPU,大多数研究将受到计算能力的严重限制。 SCC-GN6是首个基于X-Dragon架构的超算异构产品,神龙云服务器与阿里云ECS、GPU云服务器等一起,最多可达512个节点,计算性能依旧接近线性增长,提供堪比超算中心的并行计算资源。

_

神龙异构超算集群性能接近线性增长

这不仅因为支持节点数量多,更因为集成多项自研技术:软硬结合的X-Dragon架构兼具性能和灵活性,50G RDMA超算网络降低网络延时,百万级IOPS性能的ESSD块存储提供低于百微秒的读写延时,高性能并行文件系统CPFS读写吞吐达1TB/s,分布式加速框架Ali-Perseus对集群内每一颗GPU工作负载进行优化和加速。最高可以实现100%的性能提升,从而最大限度发挥芯片的计算性能。 以ImageNet竞赛的128万张图片的数据集为例,用普通计算资源训练ResNet50模型,如要达到75%的精度需要数天甚至一周的时间,而使用该神龙异构超算集群产品,模型训练可以缩短到几分钟,大大提升AI算法研发效率,加速业务创新。 阿里云智能创新产品线负责人张献涛表示:“人工智能对算力提出了新挑战,神龙异构超算集群提供了堪比超算中心的并行计算资源,用户可以随时获取高性能计算能力,更不用担心购买、搭建GPU需要耗费的时间成本。” 此外,阿里云还发布了国内首个公共云上的轻量级GPU异构计算产品——vGN5i,打破传统直通模式局限,提供比单颗物理GPU更细粒度的服务,从而让用户以更低成本、更高弹性开展业务。 作为国内第一、全球前三的云服务商,阿里云于2017年10月发布了全球首个新一代“跨界”服务器弹性裸金属服务器神龙X-Dragon,拥有接近物理机的性能以及虚拟机的灵活性,提供了新的计算资源获取方式,已经大规模服务于智能客服助手、智能翻译、无人驾驶、智能推荐等场景。 在2019阿里云峰会·北京上,阿里云还提出未来将围绕IT基础设施的云化、核心技术的互联网化和应用的数据化、智能化,持续推出符合用户需求的产品,同时致力于被生态伙伴集成,不做SaaS并帮助企业做更好的SaaS。除了神龙异构超算集群外,阿里云还发布了新版本POLARDB可兼容Oracle、SaaS加速器和小程序云。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/3332.html

相关文章

  • 阿里首次分享新产品策略,围绕“三化”升级产品体系

    ... 围绕“三化”,阿里当天即发布多款重磅产品,包括神龙异构超算集群、新版本POLARDB可兼容Oracle数据库、轻量级GPU异构计算产品——VGN5i实例等。 此外,阿里再次宣布ECS服务器、块存储、高速通道等降价,最高降价幅度4...

    AlienZHOU 评论0 收藏0
  • 阿里渴望“被集成”背后的妥协和无奈

    ...racle,MySQL及PostgreSQL,扩展能力优异;SaaS加速器,集成了人工智能、虚拟现实等技术模块,ISV和开发者只要简单拖拽,就可以快速搭建SaaS应用。能帮助SaaS客户提升效率,降低成本;零售,提供支持海量高并发的分布式架构、...

    baihe 评论0 收藏0
  • 解锁高性能计算与区块链应用,阿里Kubernetes服务召唤神龙

    ...可以轻松实现混合环境应用部署管理。 随着大数据和人工智能的热潮,将会有更多高性能计算的诉求,但自建高性能计算的成本以及发布复杂度高。依靠神龙(X-Dragon)弹性裸金属服务器和容器服务的敏捷性会为高性能计算的...

    KitorinZero 评论0 收藏0
  • 阿里E-HPC联合安世亚太、联科集团共建超算生态

    ...和产品。联科集团基于阿里提供的HPC服务,将大数据、人工智能、深度学习、仿真模拟、数据分析等现代计算手段,以一种高性价比的方式,解放给各行各业、各种需求、各种规模大小的企业。联科集团成立于2000年,18年来一...

    LiuZh 评论0 收藏0
  • 阿里史上最大技术升级!正式发布飞天2.0计算操作系统

    ...务迁移至飞天平台2016年,ET城市大脑项目启动,飞天进入人工智能时代并应用于解决社会治理的难题2017年,飞天获得中国电子学会15年来首个科学进步特等奖2018年,飞天进入2.0时代,成为面向万物智能操作系统一图看懂阿...

    darryrzhong 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<