Amazon Web Services启动Nvidia安培实例

由于使用了Nvidia处理器,新的AWS实例比现有实例速度快好几倍,功能也更强大。

英伟达安培a100
英伟达

亚马逊Web服务(AWS)宣布了一个新的gpu驱动的实例,名为Amazon P4d,它基于Nvidia的新版本安培架构这两家公司都宣称自己的业绩非常出色。

AWS提供gpu驱动的实例已经有十年了,最新的一代称为P3。AWS和Nvidia都声称,与P3实例相比,P4d实例提供了3倍快的性能,高达60%的成本,以及2.5倍的GPU内存,用于机器学习训练和高性能计算工作负载。

英伟达表示,与默认的FP32精度相比,这些实例可以将训练机器学习模型的时间用FP16减少至多3倍,用TF32最多减少6倍,但也可以训练更大、更复杂的模型。

这些都是重量级的例子。带有8个Nvidia A100 GPU的P4d实例在一个EC2实例中能够进行高达2.5 petaflops的混合精度性能和320GB的高带宽GPU内存。AWS表示,P4d实例是第一个通过弹性织物适配器(EFA)和Nvidia GPUDirect RDMA网络接口提供400gbps网络带宽的实例,支持跨服务器gpu之间的直接通信,以降低延迟和更高的扩展效率。

每个P4d实例还提供96个Intel Xeon Scalable (Cascade Lake) vcpu, 1.1TB的系统内存和8TB的本地内存NVMe存储以减少单节点训练时间。通过将上一代P3实例的性能提高一倍以上,P4d实例可以将训练机器学习模型的成本降低高达60%。

“随着数据变得越来越丰富,客户正在训练具有数百万甚至数十亿参数的模型,比如那些用于文档摘要和问题回答的自然语言处理、自动驾驶汽车的目标检测和分类、大规模内容审核的图像分类、电子商务网站的推荐引擎、以及智能搜索引擎的排名算法——所有这些都需要增加网络吞吐量和GPU内存,”AWS在一份声明中说。

该公司表示,客户可以使用AWS深度学习容器运行P4d实例,该容器带有Amazon Elastic Kubernetes Service (Amazon EKS)或Amazon Elastic Container Service (Amazon ECS)的库。为了获得更全面的管理体验,客户可以通过Amazon SageMaker使用P4d实例,该实例旨在帮助开发人员和数据科学家快速构建、培训和部署ML模型。

HPC客户可以利用AWS Batch和AWS ParallelCluster与P4d实例来帮助编排作业和集群。P4d实例支持所有ML学习框架,包括TensorFlow、PyTorch和Apache MXNet,让客户可以灵活选择他们喜欢的框架。

P4d实例在美国东部(北维吉尼亚州)和美国西部(俄勒冈州)地区可用,计划很快在其他地区可用。AWS实例的定价从32.77美元每小时但一年期预约的费用降至每小时19.22美元,三年11.57美元。

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对最重要的话题发表评论。

版权©2020足球竞彩网下载

工资调查:结果在