InfoWorld评论:Intel Xeon Nehalem-EX的寿命很大
英特尔的新Nehalem-EX CPU为SMP服务器带来了8核、大规模内存支持、类似大型机的RAS特性,并为大规模工作负载带来了巨大的性能提升
虽然在过去的几年里,每个人都对Itanium大加抨击,但Itanium确实拥有一些x86/x64系统梦寐以求的重要上层特性。这些特性中的许多都在RAS(可靠性、可用性和可服务性)领域——例如故障内存隔离、热插拔RAM、套接字内存镜像、损坏数据容纳和CPU热添加等功能。在Nehalem-EX发布之前,这些特性在Xeon的世界里根本不存在。他们现在做的。
Nehalem-EX芯片是专为大容量SMP服务器设计的,从2个插槽扩展到256个插槽,每个插槽可寻址RAM高达256GB。每个芯片有8个物理核和24MB的L3缓存,可以通过超线程呈现16个逻辑核。这些都是一流的数字。可以将1TB的RAM投入到四个插槽的Nehalem-EX服务器中。
[快速的AES加密,更好的可伸缩性,和一致的每核性能,使新的六核Xeon值得Nehalem-EP的继任者。看到“InfoWorld评论:英特尔的Westmere炫耀自己的东西”。)
理解Nehalem-EX和Westmere-EP之间的区别也很重要。Westmere-EP采用32nm制程,而Nehalem-EX采用45nm制程。Westmere-EP像X7400 Dunnington一样有六个核,而Nehalem-EX有八个核。Westmere-EP的L3缓存最高可达12MB, Nehalem-EX最高可达24MB。Westmere-EP的运行频率为每核3.33GHz, Nehalem-EX的运行频率为每核2.26GHz(目前)。Westmere-EP有两个QuickPath互连,Nehalem-EX有四个,可以访问Westmere-EP的两倍RAM。两者都提供Hyper-Threading, Intel VT虚拟化钩子和Turbo Mode。
Nehalem-EX适用于非常大规模的工作负载。尽管Westmere-EP在时钟速率上有所提升,但它的规模远不及Nehalem-EX所提供的水平。也就是说,一些工作负载更适合Westmere-EP,特别是受益于较高时钟速率的单线程任务。
EX-treme性能为了测试Nehalem-EX,我选择了我的真实世界并发测试套件。在实验室中没有Intel x7400系列服务器,我用一台运行两个Intel X7560 Nehalem-EX cpu的Dell R810与运行四个Intel X7350 Tigerton cpu的较老的HP DL580 G3进行了对比。在深入研究结果之前,请注意这些系统之间的差异:HP DL580具有四个四核X7350 cpu,每核2.93GHz, 4MB L3缓存。戴尔R810只有两个8核x7560运行在2.26GHz每核和12MB缓存。虽然X7560 Nehalem-EX cpu支持超线程,但DL580中的x7350不支持。它并不是一蹴而就的,但是它很好地说明了如果您的服务器已经运行了一年以上并且运行在x7300系列平台上,那么可以获得什么样的性能提升。
我运行的测试基于许多应用程序中的常见操作。LAME测试以256Kbps比特率将152MB WAV文件转换为MP3。压缩测试使用gzip和bzip2压缩和解压缩55MB的MP3文件。MD5测试计算152MB文件的MD5和,MP4到FLV测试将24MB的MP4文件转码为FLV。这些测试是单线程的,但是并发运行,并发级别不断增加,以增加物理和逻辑核心、内存带宽、内存互连以及磁盘I/O的压力。
在Nehalem-EX上,我在启用和禁用超线程的情况下运行了这些测试。为了进行比较,我将引用禁用Hyper-Threading的结果,以便这些数字表示相同数量的逻辑cpu。所有测试都在CentOS 5.4上运行。报告的数据来自从ramdisk运行的测试,以消除磁盘I/O成为瓶颈。
结果开始有些平淡无奇。使用8个并发进程,在LAME和gzip测试中,DL580中的4个X7350 cpu与R810中的2个Nehalem-EX cpu不相上下,但在其他测试中明显落后。在并发级别为16时,所有测试的差距都大大扩大,在LAME和gzip测试中,旧系统稍微领先Nehalem-EX,但在其余测试中远远落后。一旦测试开始显著地占用每个服务器上的逻辑cpu数量,Nehalem-EX就会一路领先,并在所有测试中保持领先地位。
事实上,我在48、64和96并发进程级别上运行了许多测试,以验证结果,因为性能差异非常大。例如,在64个并发进程时,双cpu Nehalem-EX系统需要2分12秒才能完成MP4-to-FLV测试。4 cpu的X7350系统花了30多分钟完成相同的任务。这是一个巨大的性能差异。两个服务器之间的性能差异只会随着并发性的增加而增大。我不仅能够将Nehalem-EX提升到768个并发进程,而且它运行测试的速度仍然比X7360运行64个并发进程的速度快大约50%。
这种极端的性能提升是由许多原因造成的。旧的X7350系统可能有两个额外的cpu和每个核670MHz的时钟速率,但它只有4MB的L3缓存,而Nehalem-EX上的L3缓存是24MB。X7350也缺乏QuickPath的优势,内存总线成为了瓶颈。因此,在较重的工作负载测试中,Nehalem-EX击败了X7360,即使每个核心的时钟速率降低,核心数量相同。在较轻的工作量中,这种差异几乎没有那么显著。
我还在一台4 cpu的AMD Opteron 8435服务器上运行了相同的测试。这些六核、2.6GHz的伊斯坦布尔cpu已经出现一年多了,而且还不能与Nehalem-EX相媲美(因为RAM更慢,L3缓存少了25%,这个版本的HyperTransport与QPI相比速度更低)。但他们对Nehalem-EX在现实世界的部署进行了合理的比较。
这些测试表明,Nehalem-EX肯定受益于更快,1066mhz的DDR3 RAM(相对于Istanbul的800MHz DDR2), QPI和增加的缓存,因为X7560在大多数测试中击败了AMD Opteron 8435,尽管没有你可能认为的那么明显。我在一个24核的Istanbul系统上运行了测试,并且再次受到人为的限制,将AMD机顶盒限制为只有16个物理核。这并不是一个完美的比较,考虑到AMD机箱中仍然有四个cpu,但这是合理的。
结果:与启用超线程的X7560相比,完整的24核AMD伊斯坦布尔系统在多个并发级别上保持了性能优势。然而,与启用或不启用超线程的X7560相比,伊斯坦布尔系统在限制为16核时失去了优势。在大多数情况下,与AMD Opteron 8435相比,X7560的优势约为10%,尽管在并发级别中略有波动。这两个服务器都超越了基于x7350的服务器,特别是在更高的并发级别上。
这个故事的寓意是,Nehalem-EX的音阶非常好。然而,AMD的新12核Magny Cours芯片可能会让它变成一场全新的比赛。
的界限逐渐模糊x86/x64服务器和大多数RISC服务器和大型机之间的一个主要区别是高端RISC平台在系统级别上处理错误检测、纠正和恢复的能力。这不是简单地确定一个内存坏了并显示故障的位置的问题,而是自动阻塞内存段并允许与另一个内存段热插拔,然后在没有任何停机的情况下通过替换恢复正常操作。Nehalem-EX中的MCA(机器检查架构)提供了这种能力,以及其他增强的可靠性特性。
提供这些特性并不像听起来那么简单。操作系统需要扮演了一个重要的部分在这个舞蹈,因为处理器需要通知操作系统的内存失败和允许操作系统重新启动一个进程使用,内存或洗牌之前远离坏RAM数据隔离和替换。
Nehalem-EX还支持热添加RAM和cpu,这意味着RAM和处理器可以动态添加到现有系统中,而无需重新引导。当然,这也需要与操作系统和固件密切沟通,所以不要期望这些功能在旧的操作系统平台上可用,尽管大多数主要的操作系统供应商表示,他们将在处理器发布时支持这些功能。
还有更多的RAS特性,比如QPI数据包重试和QPI CRC检查,它们可以增强QuickPath互连、I/O集线器热添加和内存热节流的可靠性。可以这么说,英特尔在新款Xeon上投入了大量高可靠性的功能。
尽管Nehalem-EX不能提供最快的时钟速率,但它的每CPU内核数比任何其他英特尔处理器都要多,它可以处理大量的RAM,并增加了一整套可靠性特性——这些特性以前只有安腾才有。我们很快就会看到AMD刚刚推出的Magny Cours能带来什么,但无论结果如何,很明显,x86/x64计算从来没有这么好过。
相关故事:
- InfoWorld刀片服务器回顾:戴尔、惠普、IBM争夺虚拟数据中心2020欧洲杯预赛
- 海啸和下落的板条箱:刀片服务器评论背后
- InfoWorld评论:英特尔的Westmere炫耀自己的东西
- 现代多核和下一代IT
- 英特尔(Intel)的Nehalem简直是在嘶嘶作响
- InfoWorld评论:戴尔、惠普和联想机架服务器
- InfoWorld评论:戴尔的虚拟化服务器遥遥领先
- Nehalem塔服务器:戴尔,富士通,惠普
- 最后一批炙热的太阳服务器
这个故事,”InfoWorld评论:Intel Xeon Nehalem-EX的寿命很大,最初发表于InfoWorld.com.跟踪最新的发展服务器,处理器和其他硬件在InfoWorld.com上。
阅读更多硬件在InfoWorld的硬件频道。
这篇文章,“InfoWorld评论:Intel Xeon Nehalem-EX live large”最初发表于信息世界 .
版权©2010足球竞彩网下载