跟踪和破解网络性能问题绝非易事。要确保网络效率,不仅需要识别常常令人困惑的瓶颈,还需要对组织的IT运营有近乎超自然的理解,以及在不可避免地出现问题时能够承受压力的厚脸皮。
为了让您的网络保持活力,我们概述了10个领域,在这些领域中,调整和适度投资可以带来显著的性能提升。毕竟,随着越来越多的组织寻求以线速开展业务,确保您的系统闪耀对于组织所需的竞争优势至关重要。
性能提示1:加速WAN
长期以来,IT业一直受困于租用线路和昂贵的广域网费用。使用T1线路、MPLS甚至帧中继连接多个站点曾经是保证连通性的唯一方法,但情况已经发生了变化。现在是时候调查你的替代方案了,而不是诅咒你每月的WAN账单。
[欲了解更多实用的网络技巧和技术,请下载InfoWorld的网络深度探索想要修改你的存储策略?看到信息世界的企业数据爆炸指南.]
Cogent Communications是在美国拥有大量光纤足迹的几家供应商之一。利用这些插座可能意味着大幅增加站点到站点的带宽,同时显著节约成本——这完全是位置的问题。即使在一个新的广域网设计中引2020欧洲杯夺冠热门入几个站点,也可以节省足够的资金来增加同一运营商无法访问的站点的带宽。
您可能会在这些站点之间运行自己的VPN,但如果运营商的SLA足够强大,并且网络的延迟尽可能低,这就不会成为问题。想想你所有站点的100Mbps和将WAN账单缩减一半的好处吧。
大型运营商的地盘之外的站点,在可预见的未来仍将使用租赁线路连接,可以受益于WAN加速器,如Riverbed的Steelhead设备(见InfoWorld测试中心对Riverbed Steelhead的实际测试).如果你不能增加这些卫星站点的带宽,你唯一的选择就是在不降低其效率的情况下减少这些线路上的通信量。这就是广域网优化工具的用武之地。
性能提示2:丢掉租用线路
除非你的总部在撒哈拉沙漠,否则是时候放弃网络租赁了。在时代华纳商务舱、康卡斯特商务舱和FiOS之间,一定会有更好、更便宜的方式将高速互联网带入你的环境。以10倍的网络带宽来取代现有的T1电路并非不可能,而且在不影响可靠性的情况下,只需花费一小部分成本就可以实现。
诚然,T1和T3租用线路提供了更多防止延迟的保障,但成本差异非常大,而且这些网络的成熟度——尤其是商务舱产品——已经大幅增长。是时候告诉你的电信公司,把它的聪明才智拉出来,引进更好的东西了。
上网速度慢一直是用户的一大抱怨。让他们在家里以同样的相对速度上网,对于安抚大众来说是一条很长的路。
表演小贴士3:忘记老朋友
许多企业执着于老年应用平台这样一来,IT行业就不得不承担将旧平台硬塞进新基础设施的高成本、资源密集型任务。这就是你如何使用全新的VMware vSphere架构运行少量的Windows NT4机器。
拒绝放弃过去常常会导致成本增加、宕机和核心业务系统的脆弱性。与其召开一场又一场的会议来弄清楚如何将一个10年的会计软件包转移到一个新的基础设施上,把它发射到轨道上,然后迁移到新的地方.前期成本可能更高,但与不切断这些联系所产生的长期成本相比,这些成本将相形见绌。
这既是一个技术问题,也是一个人事问题。IT行业总有一些人透过他们所青睐的技术的棱镜来看待一切,事实见鬼去吧。引导这些人度过新技术的黑暗和暴风雨之夜并不总是容易的,但请记住,固守固定目标的It管理人员可能与固守老技术一样有害。
性能提示4:建立一个实验室
没有借口。就单个服务器的成本而言,可以建立一个庞大的IT测试实验室。一台便宜、双CPU、12核、基于AMD伊斯坦布尔的1U服务器可以在一个测试场景中运行几十台虚拟机,价格约为1500美元。在Linux或VMware ESXi上使用VMware server,您可以避免软件许可费,同时维护一个完全有效的平台来测试任何东西,从软件升级到新软件包、新操作系统,等等甚至是网络架构。
将虚拟化服务器实验室与GNS3等工具结合起来,您可以构建和测试任何您想要的计划网络或系统基础设施。没有比在测试床中更容易确定资源瓶颈所在的位置的方法了,如果该测试床像在虚拟实验室中一样容易构建,那么没有理由不找到它们。此外,通过虚拟实验室,您可以找到特定服务器的最佳工作点,包括在预期(和意外)负载下,它们需要多少RAM和CPU资源才能正常工作,从而确保减少资源浪费。
表演技巧5:观察一切
网络和系统监控是瓶颈诊断的鼻祖。当用户抱怨网络速度慢时,通常与网络无关。但除非你有设备显示出问题所在,否则你只能在黑暗中寻找解决方案。
无论您是喜欢专有工具还是开源工具,都有无数的选项可用于监控从网络延迟和吞吐量到RAM和CPU利用率,再到SAN性能和磁盘队列长度的所有方面--您可以随意选择。
如果存在,则可以监视它。如果可以监控,就可以用图表表示。如果可以用图表表示,那么很有可能对结果图进行简单的阅读就能引导您找到正确的方向,大大加快故障排除工作中的问题检测部分。
在实施网络监控时,一定要千方百计。监控路由器和交换机的CPU利用率;观察以太网接口的错误率;让你的路由器和交换机记录到中央syslog服务器,并实现某种形式的日志文件分析,当有任何报告从IP冲突到电路故障时,提醒你。仔细、认真地实现和调整您的监视框架将节省大量的时间和精力,特别是在它最重要的时候。
性能提示6:了解你的应用
基础设施性能监视只能到此为止。您在网络上提供的所有计算和存储资源都被应用程序消耗掉了。对于我们中的许多人来说,这些应用程序形成了类似于黑洞的东西——我们可以很容易地观察到它们对我们基础设施的影响,但通常很难看到它们的内部,以了解发生了什么。
许多IT商店满足于让软件供应商在他们的网络上安装和实现应用程序;毕竟,这为IT部门减少了工作量。但是要小心——当网络慢下来时,你就有麻烦了。
花点时间测试你的应用,找出它们的弱点。无论是在用户登录时调用开销特别大的存储数据库过程,还是在备份开始时的第三个班次期间出现巨大的性能下降,您都需要提前知道可能的性能损失在哪里。
要实现这一点,请坚持在购买新应用程序之前在您的基础架构中测试它们。在测试和预测应用程序在实际生产负载下需要多少性能时,请密切关注所使用的资源量。这种测试可以发现应用程序中严重的体系结构缺陷,这些缺陷可能使应用程序不适合您的环境。最好提前知道这一点,而不是发现自己用手电筒和干草叉挡开了用户。
性能提示7:tb和纺锤数,天哪
过去几年中,磁盘容量出现了爆炸性增长。随着2TB SATA磁盘的出现,现在可以将超过10TB的磁盘塞进一个单台双机架服务器中。这很好,因为现在需要的磁盘更少了,对吧?没有那么快。
了解今天的SATA硬盘与它们较小的前辈有一个重要的共同特征是至关重要的:它们速度快。虽然可以将2TB的数据放到一个7200转的SATA磁盘上,但每个磁盘的平均随机事务吞吐量仍将受到大约80 IOPS(每秒I/O操作)的限制。除非您存储的大部分是静态的数据,否则您可能会对这些新驱动器的性能感到非常不满,因为它们的磁盘数量是1TB的两倍。
如果您的应用程序需要大量随机读写(数据库和电子邮件服务器通常符合这一要求),那么您将需要大量单独的磁盘来获得必要的事务性能。虽然巨大的磁盘非常适合存储不太常用的数据,但您最宝贵的数据仍然必须位于由更快、更小的磁盘组成的磁盘阵列上。
性能提示8:小心装在5磅袋子里的10磅的服务器
虚拟化这是企业数据中心在很长一段时间内发生的最酷的事情。它提供了大量的可管理性和监控优势,可清晰地扩展,使灾难恢复比以往任何时候都更简单,并显著减少了需要消耗能量和释放热量的物理服务器的数量。
[有关如何最好地实施虚拟化的更多信息,请下载InfoWorld的服务器虚拟化深入研究和InfoWorld的存储虚拟化深度探索.]
但是,如果使用不当,虚拟化技术可能会让你措手不及。记住,虚拟化不是魔术。它不能凭空创建CPU、内存或磁盘IOPS。
随着虚拟化基础设施的发展,应该很容易关注CPU和内存性能。任何有价值的虚拟化管理程序都能让您看到必须使用的空间。另一方面,当您将虚拟化推向极限时,磁盘性能更难以跟踪,而且更有可能给您带来麻烦。
举个例子,假设您有100个想要虚拟化的物理服务器。它们实际上都在三年的硬件上闲置,需要1GHz的CPU带宽、1GB的内存和250 IOPS的事务磁盘性能。
您可以想象一个8插槽、6核、128GB RAM的X5650服务器能够轻松地运行这种负载。毕竟,您有超过20%的CPU和内存开销,对吗?当然,但是请记住,您需要将相当于140个15,000 rpm的Fibre Channel或SAS磁盘连接到该服务器,以便能够提供所需的事务负载。这不仅仅是关于计算性能。
性能提示9:是否重复数据删除
随着数据呈指数级增长,很自然地就会寻找一些工具来抑制昂贵存储容量的使用。其中一个最好的例子是重复数据消除.无论您是在备份和归档层中重复数据删除,还是直接存储到主存储,清除类似的数据并只存储唯一的数据,都能带来巨大的容量效益。
重复数据消除对于备份层非常有用。无论是在备份软件中还是在虚拟磁带库等设备中实施,您都可以将数月的备份保持在接近在线状态,以便随时恢复。这比每次恢复时间超过一两天就必须挖掘磁带要好得多。
然而,像大多数伟大的想法一样,重复数据删除也有其缺点。其中最主要的是重复数据删除需要大量的工作。NetApp是为数不多的在主存储上提供重复数据删除功能的主要SAN供应商之一,它也是为数不多的通过性能加速模块提供控制器硬件性能升级的主要SAN供应商之一。识别和合并存储上的重复块需要大量的控制器资源。换句话说,节省容量是以牺牲性能为代价的。
性能提示10:加速备份
备份几乎总是比您希望的慢,而且备份性能问题的故障排除通常更像是一门艺术而不是科学。但是,几乎每个备份管理员都会在某些时候遇到一个共同的问题。