赞助

您的性能监控策略中有哪些内容?

理解核心需求可以简化向云计算、SDx和物联网的迁移

当组织希望改进应用程序和服务交付、整合现有的性能监控工具和职责或证明新技术部署的影响时,有一些关键组件可以作为有效性能监控策略的基本构建块。

将您的策略分解为这些组件可以提高理解能力,同时明确并达成业务性能监控需求的一致意见,特别是在云、物联网和软件定义一切都获得显著发展势头的环境中。

第一个组件是collection。任何性能监视策略都从数据收集开始。如果你不能监控它,你就不能管理它。为了防止可见性差距,您的性能监控平台应该是数据不可知的,使用高频轮询到第二轮。当然,细粒度的数据收集您可以维护数据时只是有用
足够的时间,所以要确保你可以保持调查数据准确的预测能力。应用程序、系统和网络设备通过云计算和虚拟化产生大量的机器数据,这只会增加问题。如果监视平台不能满足数据收集和报告需求,那么基础设施性能的可见性就会出现显著差异。

建立基线。在所需粒度上收集了最广泛的性能数据集之后,就应该为监视的每个指标建立基线了。在任何给定的时刻,特别是在动态虚拟化环境中,了解“正常”条件是什么是非常重要的。基线将成为有效预警方法的基础。

设置警报。除了设置静态阈值外,还必须基于与基线性能的偏差建立警报。除了关于高带宽使用情况的日常警报外,您还需要知道在工作时间内,由于用户发起的独特操作,何时会出现意外的峰值。您应该能够指定对于任何度量标准,您认为可以接受多少个标准差。这需要了解所有被监视指标的基准历史性能。此方法为影响服务的事件提供了更可靠的预测器,并有助于减少误报。

创建报告。封闭的报告揭示了使用最多的接口,最高的包丢失和其他关键指标。但是,它们不允许在故障诊断性能问题时通常需要的操作级别。您需要能够在单个屏幕上绘制任何时间序列指标或报告,以帮助关联服务退化的原因。您还需要了解监视的对象数量的增加如何影响报表平台的速度。依赖于集中式数据库体系结构的性能监视解决方案在被监视域扩展时报告速度会显著下降。最好以分布式方式维护信息,并让系统在需要时查询数据。不能提供接近实时信息的报告是不可接受的。

分析数据。其目标是找到前瞻性地检测和避免性能事件所需的可操作的洞察力,理解能够帮助调整基础设施的相关性,并就基础设施对业务的影响做出更明智的预测决策。正确分析性能数据的关键是将所有数据放在一个地方。这意味着从单一平台访问度量、流和日志数据,以避免“转椅”分析。

分享的结果。一旦具备了收集、基线、警报、报告和分析性能数据的战略能力,就该与能够真正从监视结果中获益的团队成员分享见解了。这需要了解你的听众。例如,CTO最感兴趣的是服务水平甚至是市场水平的表现观点。共享信息还意味着与其他平台共享数据,比如故障或配置管理解决方案。导出数据应该和吸收数据一样容易。

记住要专注于改进过程,以减少时间和精力的浪费。将性能监视过程分解为组件可以清晰地了解您的策略。通过理解监视策略的核心需求,您还掌握了在评估监视供应商的性能时做出明智的购买决策的知识。

如需更多信息,请下载此白皮书有效的绩效监控策略的6个步骤

相关:

版权©2015足球竞彩网下载