Nvidia基于 Arm处理器核心部分,公司引进了一台超级计算机,设计用CPU/GPU组合执行AI处理
新系统计算技术会议正式介绍台北DGXGH200超级计算机电源组合NvidiagraceCPU,72核心冲处理器,设计高性能计算和HopperGPU双联通NVLink-C2C高速互连
DGXGH200特征大规模共享存储空间 144TBH3内存通过NVLink-C2C互连技术连接系统简化设计,处理器被Thier软件看成一个巨型GPU 内存池Ian Buck说Nvidia超尺度HPC业务单元副总裁兼总经理
系统可部署训练Nvidia使用AI模型,这些模型需要存储超出单GPU支持范围需要全新系统架构破解记忆层以训练这些巨型模型
Nvidia称前aFLOP性能,大部分AI处理程序使用16位bfloat16指令,需要2倍时间一种方法看它,你可以有超级计算机排名前十Top500超级计算机列表并占有相对小空间
使用NVLink取代标准PCIExpress互连,GPU和CPU之间的带宽速度为7倍,需要连接功率的五分之一
Google云、Meta和微软是第一批期望访问DGXGH200以探索其基因化AI工作量能力者Nvidia还打算提供DGXGH200设计,作为云服务提供商和其他超标的蓝本,以便他们能为基础设施进一步定制NvidiaDGXGH200超级计算机预计到年底可使用
软件包含
超级计算机随同Nvidia软件安装提供全包产品,包括NvidiaAI企业软件层基础命令企业级集群管理
DGXGH200系统是首台超级计算机,与NVLink切换系统对齐NVDIA系统上一代系统以8GPU并发
实现全尺寸系统仍需要大量数据中心房地产15分机底盘保留8分计算节点,每组有2分底盘(或Nvidia语句中播客)以及NVSwitchethernet和IP连通性8类可连通256处理器
系统冷却,尽管HopperGPUs抽出700瓦电量,这意味着高热量Nvidia表示,它内部开发液冷系统并正与客户和伙伴商谈它,但目前DGXGH200为风扇冷却
系统有效用户目前尚不准备液化冷却 Charlie Boyle表示 NvidiaDGX系统副总裁未来会有一些点点 设计需要液化冷却
Nvidia计算显示Grace-Hopper超级芯片完全制作OEM伙伴系统预期今年晚些时候交付