如果你的桌面上有一台配备Volta GPU的高性能Nvidia DGX-1超级计算机,你就不需要购买400台服务器。
DGX-1超级计算机看起来就像一台普通的机架服务器,它的大部分计算能力来自8个特斯拉V100 gpu。
这是第一款基于全新Volta架构的GPU,于周三在加州圣何塞举行的Volta GPU技术会议上被介绍。
“它从盒子里出来,插上电源,就可以开始工作了,”英伟达首席执行官黄仁焕在一次主题演讲中说。
但是搭载特斯拉V100电脑的DGX-1很贵。它价值149,000美元,值得一些人毕生的积蓄。但黄鼓励人们订购,并表示该盒子将在第三季度发货。
新的超级计算机40,960个CUDA核心,这Nvidia公司表示,等于800个的CPU的计算能力。它取代了前一DGX-1基于当前帕斯卡架构,其具有250双路服务器的功率,根据NVIDIA。
Nvidia公司表示,该系统的半精度16位浮点性能可达960万亿次浮点运算,这意味着单精度和双精度性能会降低。这些数字无法获得,但半精度的性能被认为对机器学习任务很有价值。
伴随着GPU是两个20核Intel Xeon E5-2698 V4S为2.2GHz的时钟速度运行。该系统有四个1.92TB的SSD,运行在Ubuntu Linux操作系统。
这个系统要消耗3200瓦的电力,所以不要让它整天运行,否则会增加你的电费。
游戏玩家不应该对这台机器感到兴奋。带特斯拉V100的DGX-1可能太贵了,不可能成为一个巨大的游戏平台;它更多的是为机器学习而设计的。
GPU的功耗已经机器学习在数据中心的任务,和NVIDIA的超级计算机是GPU是如何使像图像2020欧洲杯预赛识别和自然语言处理现实应用的一个例子。
黄表示,cpu无法为计算提供足够的能量,尤其是对于人工智能而言,而这正是GPU所适合的。
黄说,DGX-1的特斯拉V100比目前的帕斯卡架构快5倍。它将拥有像NVLink 2.0这样的新技术,这是一种带宽高达300Gbps(比特每秒)的新型互连技术。该GPU拥有超过210亿个晶体管和5120核。它还有900GBps(字节每秒)的HBM2内存带宽。
Nvidia还包括一个立方体状的张量核心,它将与常规的处理核心一起工作,以提高深度学习。Nvidia专注于构建加速矩阵乘法的核心,这是有效的深度学习系统的核心。该结构将有助于对齐低级浮点计算,这将加速深度学习。
黄夸口说,该GPU提供了120万亿次浮点深度学习的性能,尽管这很难证实。虽然像谷歌这样的公司正在开发针对机器或深度学习应用程序的标准基准测试工具。
这台超级计算机与许多高性能计算和深度学习框架一起工作,如CUDA、张量和咖啡因2。
这家图形公司还推出了DGX工作站,它是新的DGX-1的一个更小的版本。它看起来更像一个工作站,拥有四个特斯拉V100 gpu,是DGX-1的一半。它的定价为6.9万美元,将在第三季度发货。
英伟达没有立即透露这些产品是否会销往全球。