最近的一次Amazon宕机导致一小部分客户丢失了存储在其帐户中的生产数据。当然,这导致了此类事件之后出现了典型的反云评论。
事实是,这些客户的数据丢失与云无关,而与人们对基础设施即服务(IaaS)资源的普遍误解有关。
发生了什么事?
在劳动节周末,亚马逊的US-East-1地区的一个可用区域停电了。备用发电机启动了,但由于未知的原因,它们很快就失灵了。(至于为什么发电机这么快就坏了,没有给出任何解释。)尽管弹性块存储(Elastic Block Store, EBS)数据在多个服务器之间进行复制,但停机会影响多个服务器。在EBS中存储的大量数据是正常的,或者可以在停机后轻松恢复;然而,。5%的数据无法恢复。没有备份EBS数据的.5%的客户实际上丢失了数据。
人们常说可以外包,但不能外包责任。如果您要使用另一家公司的服务来存储您公司的重要数据,那么您需要了解该服务是如何工作的。这包括它提供了什么本地保护工具,更重要的是,它没有提供什么保护。本文讨论了主要云提供商提供的块存储产品,另一篇文章将解释基于云的对象存储——操作(和受保护)非常不同的服务。这两种服务的用途、设计和保护功能完全不同。
什么是云块存储?
所有主要的IaaS供应商都提供块存储,它本质上是云中的一个非常可靠的虚拟硬盘。例如,Amazon有弹性块存储,Azure有托管磁盘,谷歌有分区持久磁盘。如果您认为云中的块存储只不过是一个非常高级的硬盘驱动器,那么您需要做什么来保护它就会变得非常明显。挑战在于,许多人认为所有的云存储都是自动保护的,而事实并非如此。
许多云块卷都是通过复制来保护的在可用区域内- - - - - -