英伟达帕特在云中云是一个人工智能的超级计算机,为企业用户提供设计要求的需求和财力雄厚。提供之际,一个完整的软件和硬件方案大规模人工智能的发展,可以通过web浏览器访问。
帕特云给了企业能力训练等现代人工智能工作负载生成AI和大型语言模型,NVIDIA的副总裁查理·博伊尔说帕平台。它结合了一个AI开发者套件、工作流软件,一个高性能的基础设施,直接访问NVIDIA AI专家,和24/7的支持。
市场影响生成的人工智能
生成AI的到来引发了对基于AI的需求快速增加的产品和服务。因此,公司正竞相收购所需的技能和基础设施利用人工智能的产品开发流程和业务操作。
与帕特云,企业可以获得几乎即时访问完整的AI超级计算环境中,而不必担心软件兼容性,优化数据中心空间、电力、冷却,或安装和维护所需的专业知识一台超级计算机集群,博伊尔说。2020欧洲杯预赛“它让他们专注于创新,而不是基础设施和让他们在几天,而不是几个月。”
云解决方案工程师弗拉季斯拉夫•Bilay Aquiva实验室,应用程序和软件开发服务公司,补充说,“它使研究人员、开发人员和数据科学家远程访问和使用NVIDIA的帕特系统,不再需要昂贵的本地硬件。”
Bilay说,帕特云提供了一个无缝和可伸缩环境培训和部署人工智能模型,允许用户利用NVIDIA技术,加快工作流程灵活和方便的方式。
帕特云的关键优势之一是与流行的AI框架和工具的紧密集成。“它支持TensorFlow这样的框架,PyTorch MXNet,允许用户利用他们喜欢库和api”。Bilay adds that DGX Cloud also provides access to NVIDIA’s comprehensive software stack, which includes drivers, libraries, and frameworks tailored for AI development.
总经理斯科特猪油和IS&T,合伙人,位于休斯顿的信息系统和技术保留搜索和应急人力资源公司,补充说,帕特云提供了一个机会,利用高性能计算(HPC)的力量和人工智能不需要昂贵的硬件投资。
“用户可以利用NVIDIA的健壮的基础设施、远程访问强大的GPU资源,加速他们的工作负载,深度学习、数据分析,或科学模拟,”他解释说。“这就像一个虚拟的AI强国在指尖,准备彻底改变你的计算能力。”
多个组件
帕特云包含多个集成组件。用户访问帕特云使用NVIDIA基础命令从web浏览器平台软件。“这是帕特云的中央枢纽,多个用户管理自己的完整的人工智能开发工作流,”博伊尔说。“这消除了大规模的人工智能培训资源共享的复杂性,利用多个实例,被称为“多节点训练”,这通常是难以实现的,一个易于使用的图形用户界面和综合监测和报告工具。”
帕特云也包含了NVIDIA AI企业,英伟达AI平台的软件层,其中包括超过100 pretrained模型,优化加速数据科学软件框架和库。这些插件给开发人员一个额外的人工智能项目启动,博伊尔指出。
组织租金多个云实例和帕特,作为回报,奉献,全职访问在租赁期间,博伊尔说。实例自动出现在基地指挥平台软件,允许用户提交和运行工作。
每个实例包含八个NVIDIA H100或A100 80 gb的张量核心GPU,总共640 gb的GPU内存每个节点。博伊尔说,一个高性能、低延迟织物,由NVIDIA网络,确保工作负载可以在集群规模的互连系统,允许多个实例,以满足性能要求的先进的人工智能训练。高性能存储也集成在帕特云。
从财务角度,帕特云提供了一些显著的好处和优势。方法不需要客户投资和管理自己的昂贵的硬件基础设施。“这可以节约成本,增加灵活性,和可伸缩性的AI和深度学习努力,“Bilay解释道。
帕特云与流行的人工智能集成框架和工具,简化了开发工作流程。也重视安全和数据隐私,确保用户能够自信地处理敏感数据和模型。“总的来说,帕特云授权用户通过提供一个高性能、灵活,和用户友好的云平台根据他们的人工智能和深度学习的需要,“Bilay说。
需要,但不是便宜的
博伊尔说,通过提供专用的AI超级计算实例,帕特云满足关键需要通过允许企业迅速站起来服务和实惠。NVIDIA与领先的云服务提供商包括甲骨文云基础设施,微软Azure和谷歌云主机帕特云基础设施。
帕特云实例从每月36999美元每个实例开始,没有额外的费用的人工智能软件或数据传输。所以,每年444000美元的一个实例,这是一个反复出现的成本。
当用户发起一个任务,如培训一个人工智能模型,他们的工作是在云中可用的帕特系统上处理。这些系统功能的高性能NVIDIA gpu专门为深度学习优化工作负载。用户数据和模型是安全地转移到帕特系统,计算发生的地方。
帕特云支持主要的人工智能平台和工具,确保兼容用户的首选库和api。这允许用户无缝地开发和部署他们的人工智能模型在云中,Bilay说。
开始
博伊尔说,客户和他们的团队可以获得速度很快。NVDIA提供八个相互关联的每个实例gpu和提供访问每个地区的大规模云托管在帕特。服务的网络结构是基于NVIDIA的技术,博伊尔声称提供高带宽,低延迟互连优化的多节点的训练。他还指出,一个简单的用户界面,允许用户运行多节点的培训工作。
一个多重云方法避免了与任何一个云提供商需要锁定,博伊尔说。“帕特云基础命令混合云管理平台提供了一个窗格视图在云和on-prem资源。”
其他注意事项和警告
帕特云并不是唯一的球员提供这种类型的服务。主要竞争对手包括谷歌云AI平台,Amazon AWS深度学习ami,微软Azure机器学习,和IBM Watson工作室。“这些平台提供类似的功能,比如可伸缩的计算资源,与流行的AI框架的集成,并支持深度学习工作流,“Bilay说。
部署和使用成本的帕特云等因素而异订阅计划,资源分配和使用时间。NVIDIA提供不同的定价模型和计划针对用户的特定需求,Bilay说。
拥抱云解决方案使得用户依赖于服务提供商的基础设施和支持,Bilay警告说。故障和技术问题在提供者的一端会影响平台的可用性和性能,可能影响项目的执行和时机。
更不妙的是,特别是对于组织有严格的数据隐私或合规要求,使用云平台可以提高数据安全性和隐私问题。“虽然NVIDIA帕特云实现了安全措施,重要的是用户评价平台的安全协议,确保他们满足他们特定的法规遵循需求,“Bilay建议。