作为服务的高性能计算的来龙去脉

HPC服务可以一种方式来满足不断扩大的超级计算需求,但根据不同的使用情况下,他们未必就比本地超级好。

戴尔EMC

导弹和军用直升机上的电子设备需要在极端条件下生存。在这些物理硬件能够投入使用之前,国防承包商McCormick Stevenson Corp.依靠Ansys等需要强大计算能力的有限元分析软件,模拟了这些硬件将承受的真实环境。

几年前的一天,它出乎意料地遇到了它的计算极限。

麦考米克史蒂文森公司的首席工程师迈克•克劳茨克表示:“我们的一些工作可能会让办公室里的电脑不堪重负。”“购买一台机器并安装软件在经济上或时间上都没有意义。”Instead, the company contracted with Rescale, which could sell them cycles on a supercomputer-class system for a tiny fraction of what they would've spent on new hardware.

麦考密克·史蒂文森已经成为市场的早期采用者称为超级计算作为一个服务的服务或高性能计算(HPC) - 这是密切相关的两个术语。HPC是超级计算机到计算上复杂的问题的应用,而超级计算机在处理容量的切削刃的那些计算机,根据国家研究所计算科学。

不管它叫什么,这些服务正在颠覆传统的超级计算市场,并将高性能计算的能力带给那些以前从来买不起的客户。但它不是万能药,也绝对不是即插即用的——至少现在还不是。

在实践中HPC服务

从最终用户的角度来看,高性能计算作为一种服务类似于批处理模式,可以追溯到早期的大型机时代。“我们创建An​​sys的批处理文件,并发送了,它运行后,我们拉下结果文件和本地这里导入它们,” Krawczyk说。

在幕后,云提供商在他们自己的数据中心运行超级计算基础设施——尽管这并不一定意味着你听到“超级计算机”时可能会想象到的那种尖端硬件。2020欧洲杯预赛As Dave Turek, Vice President of Technical Computing at IBM OpenPOWER, explains it, HPC services at their core are "a collection of servers that are strung together with an interconnect. You have the ability to invoke this virtual computing infrastructure that allows you to bring a lot of different servers to work together in a parallel construct to solve the problem when you present it."

在理论上听起来简单。但是,使其可行的实践中需要进行一些小打小闹的技术问题,根据西奥琳,在都柏林城市大学数字商务的教授。从什么区别HPC计算一般是那些互连 - 高速,低延迟,和昂贵的 - 因此那些需要被带到云计算基础架构的世界。存储性能和数据传输也需要在同一个球场长大到一定程度至少为的预置型HPC前HPC服务可以是可行的。

但林恩说,一些已经帮助HPC服务创新的腾飞已经比技术更多的机构。特别是,“我们现在看到的采用云友好的许可模型越来越多的传统HPC应用 - 一个屏障,采用了过去。”

而经济学也转移了潜在客户群,他说。"Cloud service providers have opened up the market more by targeting low-end HPC buyers who couldn’t afford the capex associated with traditional HPC and opening up the market to new users. As the markets open up, the hyperscale economic model becomes more and more feasible, costs start coming down."

避免内部部署CAPEX

HPC服务是在传统的超级计算机长期以来一直摇摆在同一领域的私营部门客户的吸引力。这些措施包括,在很大程度上依赖于复杂的数学建模领域,包括国防承包商像麦考密克·史蒂文森,石油和天然气公司,金融服务公司,以及生物技术公司一起。都柏林城市大学的林恩还说,松散耦合的工作量是一个特别良好的使用情况下,这意味着许多尝鲜用它的3D图像渲染和相关应用。

但当是否有意义了内部部署HPC考虑HPC服务?对于hhpberlin,一家德国公司,模拟烟雾传播和火灾损坏的建筑物的结构组件,这一举动是因为它超出了其现有资源。

“几年来,我们已经运行了多达80个处理器内核自己的小集群,”苏珊·基利安,hhpberlin的数值模拟的科学负责人说。“随着应用复杂性上升,但是,这个星座越来越被证明是不够的;可用容量并不总是足够的及时处理项目。”

但是,仅仅把钱花在一个新的集群上并不是一个理想的解决方案,她说:“考虑到我们公司的规模和管理环境,经常维护这个集群(定期的软件和硬件升级)是不现实的。另外,所需的模拟项目的数量可能会有很大的波动,因此集群的利用率实际上是不可预测的。通常,使用非常频繁的阶段与很少或没有使用的阶段交替。”通过moving to an HPC service model, hhpberlin shed that excess capacity and the need to pay up front for upgrades.

IBM的Turek解释了不同公司在评估他们的需求时所做的计算。对于一家只有30人的生物科学初创公司,“你需要计算机,但你真的负担不起15%的员工致力于此。”这就像你可能会说你不想要正式的法律代表,所以你也会得到这种服务。”For a bigger company, though, it comes down to weighing the operational expense of an HPC service against the capacity expense of buying an in-house supercomputer or HPC cluster.

到目前为止,这些都是关于采用任何云服务的相同类型的争论。但从高性能计算市场的一些具体情况来看,运营成本与资本支出的两难境地可能倾向于前者。超级计算机不是像存储或x86服务器那样的普通硬件;它们非常昂贵,技术进步可以很快使它们过时。正如麦考米克•斯蒂文森(McCormick Stevenson)的克劳茨克(Krawczyk)所言:“这就像买车一样:你一把车开出停车场,它就开始贬值。”And for many companies –especially larger and less nimble ones – the process of buying a supercomputer can get hopelessly bogged down. "You're caught up in planning issues, building issues, construction issues, training issues, and then you have to execute an RFP," says IBM's Turek. "You have to work through the CIO. You have to work with your internal customers to make sure there's continuity of service. It's a very, very complex process and not something that a lot of institutions are really excellent at executing."

一旦您选择沿着HPC的服务路线走下去,您将发现您将从云服务中获得许多您所期望的优势,特别是在需要HPC功能时仅为其付费的能力,这将导致资源的有效利用。Gartner高级总监和分析师色拉格•德凯特说,当你有短期的高性能计算需求时,高负荷的工作量是推动高性能计算服务被采用的一个关键用例。

他表示:“在制造业,高性能计算活动往往在产品设计阶段达到高峰。”“但是一旦产品被设计出来,HPC资源在产品开发周期的剩余时间里就很少被利用了。”In contrast, he says, "when you have large, long-running jobs, the economics of the cloud wear down."

巧妙的制度设计,你可以用你自己内部的传统计算整合活动的HPC服务阵阵。邓丽君东,埃森哲实验室董事总经理,给出了一个例子:“访问HPC通过API使得它无缝与传统计算混合传统的AI管线可能其培训在高端超级计算机完成的阶段,当该模型存在。开发,但随后产生的培训模式,一遍又一遍地运行预测会在边缘处的云,甚至设备等服务部署“。

这不是对所有的用例

高性能计算服务的使用适合于批量处理和松耦合的使用情况。这关系到一个共同的HPC缺点:数据传输的问题。高性能其本质计算往往涉及巨大的数据集,并发送所有在互联网上的云服务提供商的信息是没有一个简单的事情。“我们的客户我跟在生物技术产业谁花月1千万笔$上不仅仅是数据费用,” IBM的Turek先生说。

而且钱不是唯一的潜在问题。建立一个工作流程,利用你的数据可以挑战你为数据传输所需的长时间解决。“当我们有我们自己的HPC集群,本地访问已经产生的模拟结果 - 因此一个互动的中期评估 - 是当然,可以在任何时间,” hhpberlin的基利安说。“我们目前的工作能够访问和评估云计算在模拟中的任何期望的时间,而不需要下载大量的模拟数据的产生更加高效,交互的数据。”

迈克Krawczyk援引另一绊脚石:合规性问题。任何服务国防承包商的使用需要被控告与国际武器贸易条例(ITAR)和麦考密克 - 史蒂文森重缩放进去一部分,因为它是唯一的供应商,他们发现,检查了盒子。尽管有更多的做的今天,任何一家公司希望使用云服务应该意识到参与活在别人的基础设施的法律和数据保护的问题,许多HPC的使用情况的敏感性,使这个千真万确的HPC作为服务。

此外,IT治理是HPC服务需要超越监管需求。举例来说,你需要保持你的软件许可证是否允许使用云赛道 - 尤其是写入到本地HPC集群上运行的专门的软件包。而在一般情况下,你需要跟踪的你如何使用HPC服务,它可以是一个诱人的资源,特别是如果你从那里的工作人员已经习惯于闲置的高性能计算能力可用的内部系统转换。举例来说,罗恩·吉尔平,在Avanade的高级主管和Azure平台服务的全球领先优势,建议回拨您使用的是不是时间敏感的任务有多少个处理核心。“如果作业只需要一个小时,而不是十几分钟内完成,”他说,“可能使用165个处理器,而不是1000,十万美元储蓄。”

在HPC技能溢价

一到HPC采用的最大障碍一直是独特的内部技能它需要和HPC服务并不神奇地让这道屏障消失。“许多CIO已经迁移了很多他们的工作负载到云,他们已经看到了节约成本和提高灵活性和效率,并相信他们能够实现HPC生态系统类似的结果,” Gartner的Dekate说。“而一个普遍的误解是,他们可以通过某种方式从本质上系统管理员移开和雇用新的云计算专家谁能够解决他们的HPC工作负载优化人力资源成本。”

“但是,HPC是不是主要的企业环境中的一个,”他说。“你处理高端计算节点互连,高带宽,低延迟的网络协议栈,具有令人难以置信的复杂应用程序和中间件堆栈一起。即使在许多情况下,文件系统层是唯一的HPC环境。由于没有合适的技能可能是不稳定的。”

但是超级计算机技能是缩短供应,一些Dekate所指的劳动力“老龄化”,在一代人的开发商去引人注意的初创企业,而不是学术界还是比较稳重的企业,其中HPC在使用过后。其结果是,高性能计算服务的厂商在做什么,他们可以缩小差距。IBM的Turek先生说,很多HPC兽医总是要推出自己的精美微调代码,需要专门的调试器和其他工具,以帮助他们做到这一点的云。但即使是新手HPC可以通过供应商构建利用超级计算的并行处理代码库的调用。和第三方软件提供商出售交钥匙软件包,抽象掉许多HPC的并发症。

埃森哲(Accenture)的董建华(Tung)表示,该行业需要进一步向这个方向倾斜,以实现真正的繁荣。她说:“HPCaaS已经创建了非常有影响力的新功能,但是现在需要做的是让数据科学家、企业架构师或软件开发人员更容易地应用它。”这包括易于使用的api、文档和示例代码。它包括回答问题的用户支持。仅仅提供API是不够的;该API需要适合于特定用途。对于数据科学家来说,这应该是在Python中实现的,并且很容易在她已经使用的框架中进行更改。价值来自于让这些用户能够通过新的效率和性能改善他们的工作,只要他们能够访问新的功能。”If vendors can pull that off, HPC services might truly bring supercomputing to the masses.

加入对网络世界的社足球竞猜app软件区Facebook的LinkedIn对那些顶级心态的话题发表评论。

版权©2020足球竞彩网下载

IT薪资调查:结果在