如何在采用AI时管理电源账单

拥抱ai并不意味着炸毁你的电费。以下是如何最大限度地减少疼痛。

虚拟二进制数据中心服务器和电缆2020欧洲杯预赛
matejmo / getty图像

人工智能(AI)和机器学习(ML)可以是可宝贵的工具来刺激创新,但它们具有不同的管理要求,而不是在适度CPU和内存利用率运行的典型企业IT应用程序。由于AI和ML倾向于在非常高的利用率下运行强烈的计算,因此功率和冷却​​成本可能消耗比IT组可能期望的预算更高比例。

这不是一个新问题,但影响正在加剧。

随着数据仓库和商业智能等更多CPU重型的应用程序变得普遍,它往往忘记了它的电信账单,特别是因为账单通常去OPS部门,而不是它。

“数据 - 科学团队领导者经常有Blanche随时随地处理任何东西,”AI开发人员的首席执行官和创始人Mark Swartz说神经。“解决重大计算要求的这些豪华方法的日子将在未来五年内开始趋势。”

用于更大审查电力和冷却成本的一个原因是AI通常依赖于高性能计算(HPC),而数据仓库和商业智能应用可以在标准系统上运行。中国首席执行官Addison Snell表示,HPC和AI频率更热,而且没有人应该被增加的账单所说intersect360是一家专门从事HPC问题的研究公司。

“与任何类型的IT努力有关的成本可以运行热量。如果您没有为AI准备,那么如果您认为它与[常规] Enterprise It服务器相同,您可能会惊讶于电源和冷却费用斯威尔说。

那么可以做些什么来避免贴纸休克?以下是六个步骤。

1)距离昂贵的电源选择

如果您可以选择将数据中心放在公司办公室以外,请寻找良好的可再生能源来源,从水电2020欧洲杯预赛开始。水力发电是最便宜的电力源之一。“微软和谷歌有一个原因,他们的数据中心位于大型水域附近,”惠普市场动态高级顾问Steve Conway2020欧洲杯预赛说Hyperion研究

风电也比化石燃料昂贵,这就是为什么许多数据中心位于中西部的原因。2020欧洲杯预赛和电器是农村地区便宜比大城市。大多数数据中心都在主要城市出于必2020欧洲杯预赛要的原因 - 北弗吉尼亚州是最大的数据中心市场,因为它靠近联邦政府 - 但在爱荷华州(微软,谷歌,Facebook)中放置数据中心并不闻名,俄克拉荷马州(谷歌)和新墨西哥州(Facebook)。

另外,在康威说,在晚上尝试在晚上运行计算密集型应用程序,康威说。

2)使用AI优化电源使用

它似乎是违反直观的,而是最好的方法之一管理您的数据中心计算机2020欧洲杯预赛是AI本身。它可以优化电源和冷却,提高工作量分配,并执行预测维护,以警告即将发生的硬件故障。这是一种不同类型的AI,一个监控而不是机器学习,它不是在系统上征税。Swartz说,服务器还可以使用传感器为电源Suppy单元和CPU中的PEACE中的峰值,并告知客户端,如果系统运行高于常量,则Swartz表示。

“只需使用AI正确,它可以帮助减少能量。如果人们开始应用AI,则可以更有效地运行许多应用程序,”Jo De Boeck,CSOIMEC.,一个专注于数字技术的研发设施。

3)使用较低的电源芯片可以在哪里

机器学习是一个两步的过程:培训和推论。训练部分涉及培训系统以识别某些东西,例如图像或使用模式。这是最具处理器的密集部分。推断是一个简单的是/否问题:这是模型的匹配吗?寻找比赛需要明显较少的处理能力,它是训练系统识别一个匹配。

GPU是培训的最佳选择,但GPU消耗高达300瓦的力量。您可以使用GPU进行推断,但为什么当一个低功率的部分都会做这个技巧时?英特尔有一个特殊的推理芯片,神经领域,它已停止支持Habana芯片。Nervana在早期测试中使用的10到50瓦的力量来执行推断。

De Boeck说,该解决方案是开发更多的特定于应用程序的硬件。“所以,而不是使用仍然是通用的CPU,或GPU,您可以看到越来越多的专业化来自硬件。特殊功能单元构建块被添加到硬件中,使机器学习算法更有效地学习。”

4)减少培训时间

另一种裙子的训练效果的另一种方式是做少。随着您与培训经历,重新审视您的培训算法,看看您可以在不失去准确性的情况下刮掉什么。

“最先进的推理需要大量的培训来做简单的任务。人们正在努力改善推理,所以当机器变得更聪明,需要较少的培训来搬出它。增加更多的智能到推理意味着较少的培训,“康威说。

培训通常用单(32位)或双精度(64位)数学进行。精度越高,处理较慢,但功耗不变。有多许多AI开发人员(包括NVIDIA和Google)说一段时间现在,在大多数情况下,您不需要这样的精度,除了可能的图像和视频处理,良好的图形精度很重要。

“仍然有很多工作正在尝试减少,例如,尝试使这些网络尽可能紧凑地,或利用算法的特定属性。公司正试图利用具体的神经网络通过减少或辨认出来的是,许多参数实际上是零,然后没有执行计算。因此,这是一个名为修剪的过程,“de boeck说。

在过去的几年里,减少精确计算慢慢获得了兴趣。Bfloat16格式是由IEEE开发的16位浮点格式,并用于英特尔的AI处理器,Xeon处理器和FPGA以及Google的TPU和Tensorflow框架。它变得流行,因为在大多数情况下它足够准确。

5)始终优化您的培训

此外,De Boeck说,还必须定期重做推理培训以改进和优化算法。“理论上,你可以在实践中只运行几次训练,但你不能说'我认为这是永久完成的,”“他说。“这些公司不断努力提高这些AI算法的表现,因此它们也不断培训或恢复它们。”

Swartz在他的ml / ai经验中说,他的团队有一个过程,他们都同意培训套装的门槛和“烘焙时间”,用于建立/重新建立新模型。通过添加新的培训信息,花费较少的时间来重新培训模型。

“所有型号必须包含转移学习,这是一种定位两个模型之间的三角洲的形式,并仅将”新“数据添加到要处理的下一个训练集中。这是我们的团队手动完成的,而现在我们的球队Swartz说,可以定位这个本身的算法。

6)看看云

所有主要云提供商都有一个AI产品,谷歌与其Tensorflow AI处理器处于最前沿。这可能证明更经济,Snell说,特别是如果你必须从头开始。

“人们经常看云以抵消预测成本。是否有利可图取决于利用率和提供者。在某处消耗了电力。您将云提供商的电力账单支付为成本的一部分。它不会自动更便宜。而且你可能如果你缺乏技能集,如数据科学,我想外包,“他说。

加入网络世界社区足球竞猜app软件Facebooklinkedin评论是最重要的主题。

版权所有©2021.足球竞彩网下载

IT薪水调查2021:结果是