(根据企业管理协会(Enterprise Management Associates)最近的研究报告《网络管理大趋势2020》(network Management Megatrends 2020),根源分析是网络故障排除工具最不支持的功能之一,该研究调查了350名网络管理专业人士关于这些工具的情况。EMA研究网络副总裁Shamus McGillicuddy在这篇文章中讨论了这一发现,并建议管理专家应该如何评估这一特性。一份关于该研究的网络会议记录是在这里)。
故障排除可能是网络运营团队最重要的职责。当IT服务中断或降级时,工程师和管理员会竞相诊断和纠正问题。每一分钟都很重要,因为当网络团队在做这项工作时,交易、员工效率和客户满意度都会受到影响。
考虑到这些利害关系,网络管理工具必须具有定义良好的工作流和技术功能来支持故障排除过程。不幸的是,许多工具让网络管理器失望了。
根本原因分析(RCA)是网络故障排除的关键方面。网络工程师必须形成一个问题的理论,并测试这个理论。只有在他们确认了自己对问题的理论之后,他们才能自信地提出解决方案。
多年来,网络经理告诉EMA, RCA是他们工作中最耗费时间的方面之一。考虑到网络管理工具显然不能支持这项任务,工程师和管理员必须自己执行复杂的计算。这些工具通常在指示板上显示大量警报阵列和时间序列图,这些图显示可能出现的问题的模式和指示器,但对问题的性质没有明确定义。因此,IT专家不得不通过寻找因果关系的模式来推断根本原因。这不是一件容易的事,特别是考虑到网络管理员说他们的工具产生的42.7%的警报是假警报,不表明一个可采取行动的问题。