Mar 30

UCloud极致性能GPU云主机荣获两项大奖

文 / UCloud 公关部

2018-09-21

在近日举行的“OSCAR云计算开源产业大会”上,国内领先中立云计算服务商UCloud荣获可信云“GPU云主机服务(增强级)认证”。并在同期举行的“2018首届MAXP中国高性能云计算创新大赛”中,UCloud的G2机型GPU凭借极致的处理性能、灵活的配置以及便捷的管理等优势,摘得“MAXP-最佳性能奖”。

同时斩获两项大奖,不仅代表了业界对UCloud产品与技术的高度认可,而且也再一次凸显了UCloud在技术创新方面的稳步提升。下面就一起来探究这些产品背后的技术细节。

高配高性能GPU云主机

人工智能(AI)引发了新一轮技术变革,而计算力是其发展最重要的基本要素之一,GPU则为AI计算提供了显著的加速能力。目前,市场主流的GPU计算卡主要是NVidia的Tesla K、M和P系列,预计V系列在不久的将来也会大规模投入市场。
此次代表UCloud出赛的正是G2型GPU云主机,搭载最新锐P40 GPU,外加Intel v4高端CPU以及大容量高性能SSD硬盘,为AI计算提供超速的计算力。根据《可信云云服务基准性能评估方法第15部分:GPU云主机》标准,将GPU性能进行等级评估,分为基础级和增强级,其中增强级为最高等级。凭借顶级硬件和系统优化,G2机型夺得增强型认证。
实际上,除P40外,UCloud亦使用K80等多种规格的GPU,并同时支持GPU物理机和GPU云主机模式,为行业用户提供足够强劲和灵活的计算资源选择方案。

完备的训练模型支持

GPU性能的官方指标主要是单精度和双精度计算值,但用户在实际进行机器学习训练时,更加关注模型训练的时间和效率。因此,贴合用户实际出发,才更能准确地鉴别GPU对人工智能的加速能力。
认证中采用了国际上具有代表性的几个训练模型,主要包括AlexNet模型、Cifar10模型、MNist模型、ResNet模型等。这些模型配合数据集做训练,运行结果保存后,去除首末端噪点数据,再对数据进行去除坏值,求最大、最小值、平均值、中位数、方差等处理,最终得到切实可信的评估值。
结果证明,G2云主机能稳定应对多种差异化的模型,达到完备可靠的加速效果。具体模型介绍如下:
◆ AlexNet模型
是Alex和Hinton参加ILSVRC2012比赛的卷积网络模型,网络结构是开启更深CNN的开山之作,在对CNN作出一些改进后,成为CNN网络通用的结构。
◆ Cifar10模型
是典型的卷积神经网络结构,包含卷积层、池化层、修正线性单元以及最顶层带有分类器的归一化采样层。
◆ Mnist模型
是一个入门级的计算机视觉数据集,包含各种手写数字图片以及60000行的训练数据集(mnist.train)与10000行的测试数据集(mnist.test)。
◆ ResNet模型
是一个深度残差网络。该网络对residual block和shortcut connection的引入,使网络能够达到更高的层数并且不会发生网络退化现象。ResNet是由KaiMing He在2015年发表,并基于该模型获得了当年ImageNet detection、ImageNet localization、COCO detection等多个比赛的冠军。
上述千差万别的模型,不仅为人工智能万紫千红的应用提供了理论支持,也是MAXP中国高性能云计算创新大赛中,各科研院所参赛队伍思维创新的基石。UCloud正是凭借此类理论基础及技术基石,再加上强大的技术团队及多年行业经验积累,荣获此次“GPU云主机(增强级)认证”和“MAXP-最佳性能奖”两项大奖。

UCloud云平台还能做更多

UCloud云平台除提供GPU云主机这类IaaS资源,还提供完整的“文曲-人工智能”解决方案。该解决方案不仅提供超高性价比的GPU计算资源,同时UAI PaaS类产品还提供一站式人工智能任务托管服务,包括AI在线服务UAI-Inference、AI训练服务UAI-Train、AI实验室Vitality等一系列IaaS/PaaS产品和服务,自动实现系统容灾、资源调度、负载均衡、容量管理等。
如果AI创新是基于AI平台而非GPU云主机进行,那么用户会省去搭建GPU驱动、CUDA等环境的工作量,也无需在配置TensorFlow等学习库时费神考量CUDA、CUDNN等版本兼容性。
基于文曲解决方案,用户的上述需求都可以通过容器镜像的快捷部署完成。平台通过综合负载监控系统来检测AI在线业务计算集群的负载情况,并根据实际负载触发扩容和缩容请求。未来,UCloud的AI平台将不断往智能化、便捷化方向演进,帮助用户实现应用快速落地。

立刻体验,即可享受30余款产品免费套餐

立即体验