在物联网领域,通用数据库无法做到这一点

物联网数据的持续流必须实时收集、测量和作用。通用数据库不能处理所有的时间序列数据,但是流感数据平台可以。

思想库

我们生活在一个仪器时代可以被测量进行测量,以便能够对其进行分析和作用,最好是实时或接近实时。这种仪器和测量过程既发生在物理世界,也发生在它的虚拟世界。

例如,在物理世界中,一个太阳能公司已经采用了其所有的太阳能电池板,以提供远程监视和电池管理。使用信息是从客户的板收集,并通过移动网络发送到云中的数据库。对数据进行分析,并将得到的信息被用于配置和适应每个客户的系统,以延长电池的寿命和控制产品。如果检测到异常或问题,警报可以发送到服务代理恶化前以减轻该问题。因此,积极为客户服务是基于来自太阳能系统未来在客户安装实时数据启用。

在IT世界里,事件被测量,以确定何时自动伸缩系统的虚拟基础架构。例如,一家公司可能希望相关的一些事情发生在一次 - 游客到一个网站,产品查询,购买交易,等等 - 来确定何时破灭云能力在短时间内,以容纳更多的销售或其他各类活动。

测量一切的想法是成为更多数据驱动的企业,才能够做出更好的业务决策,并采取基于事件,度量,或其他基于时间的数据及时采取行动。这是所有行业发生的企业使用他们的数字转换来改变他们做生意的方式。

数据库和时间序列数据 - 真实需要什么

这些数据多是时间序列数据,当发生事件时,或度量被测量,其中重要的是要加盖的精确时间。然后数据可以观察和分析随着时间的推移,了解什么样的变化在系统内发生。

时间序列数据库可以变得非常大,这取决于他们有多少事件或指标采集和存储。考虑自主车,这是收集和评估数据点的每一秒,以确定车辆应该如何运作产生巨大数量的情况。

通用数据库,诸如卡桑德拉或一个MySQL,不能很好地适合于时间序列数据。即专门用于处理时间序列数据的数据库必须具备以下能力,其中通用数据库没有。

  • 数据库需要能够几乎实时地摄取数据。有些应用程序——比如用于自动驾驶汽车的应用程序——每秒可以产生数百万或数亿个数据点,而数据库必须处理这些数据。
  • 如果要使用数据库监视和控制事物,必须能够实时查询数据库,并且查询必须能够连续运行。对于通用数据库,查询是批处理的,而不是流处理的。
  • 如果数据库是专门为时间序列数据设计的,那么数据压缩就很重要,而且相对简单。
  • 您必须能够在摄取数据的同时快速地删除数据。时间序列数据通常只需要特定的时间段,比如一个星期或一个月,然后就可以丢弃。一般的数据库无法如此快速地删除数据。
  • 最后,您必须能够通过删除一些但不是全部数据来“向下采样”。假设您每一毫秒接收一个数据点。你需要一周的高分辨率数据。在此之后,您可以删除大部分数据,但保留一些分辨率为每秒一个数据点的数据。在时间序列数据中,高分辨率在一开始非常重要,低分辨率数据在较长时间内通常也很好。

针对时间序列数据的开源项目

的创始人InfluxData保罗·迪克斯,看到这个独特的需求,他建立了InfluxData平台专门积累,分析,以及时间序列数据的作用。他开始用含有InfluxDB,核心数据库的开源项目。InfluxDB是一个非常热门GitHub上的开发者。之后,他提出了一些资金,并启动了三个开放源代码项目,完善了InfluxData平台。包括这些项目:

Telegraf-这是一个数据收集器,用于网络设备、应用程序、传感器或独立服务器等。它收集所有数据并将其发送到流感数据库。到目前为止,开源贡献者已经开发了超过160个Telegraf插件。

Chronograf- 这个可视化引擎可以让你图形,可视化和执行数据的特设探索。因为它是进入数据库,您可以在仪表板图表的数据。

Kapacitor- 作为一个协处理器到数据库,Kapacitor让你行动上的数据。它有自己的脚本语言和自己的能力,所以你可以在自定义逻辑或用户定义的函数插头。它可以在后台运行,以便让你对运行数据的机器学习算法,因为它的用武之地。Kapacitor是一个非常强大的开源项目。

称为蜱虫堆栈(Ťelegraf,一世nfluxDB,Chronograf,ķapacitor),这四个组件构成了一个强大的和流行的平台与时间序列数据的工作。一切都是可以作为开源软件开发人员。InfluxData提供了需要集群,高可用性和强大的安全生产场景闭源的商业版本。

一切仪器测量

物联网世界对蜱虫堆栈有着内在的需求。物联网的物质世界是高度敏感的。所有的东西——我们的身体,我们的衣服,医疗设备,工厂,我们的家,我们的车,等等——都被用来测量时间序列数据。这些传感器可以检测压力、温度、速度、心率、体积、光线等等,通常情况下,由于数据随时间的变化,需要采取一些行动。例如,一个身体活动跟踪告诉你放慢你的跑步速度来降低你的心率。装有避碰系统的汽车在接近静止物体时自动刹车。我们周围的传感器不断地收集和监测数据,以帮助我们(或程序)做出更好的决策。

一切的仪器是未来发展的方向,以及时间序列数据库和相关的工具将有必要收集,分析和数据行事时,它仍然是有意义的。

然后在IT的世界里,我们的系统的虚拟化创造了InfluxData平台强大的使用情况。它开始了虚拟机,因此,而不是有一个服务器,您有五个。随后的VLAN来了,所以现在有多个局域网聊天多个虚拟机一台机器上。现在我们有容器,所以也许有运行6个VM和40个箱一台服务器。然后,每个这些容器具有一组微服务的。

现在的情况是,整个软件基础设施是短暂的;一切都是虚拟的,便携的,暂时的,向上和向下。但是,我们还需要什么这些系统中发生的实时视图。因此,该软件被仪表提供实时态势数据,或什么所谓观察性。它提供了记录系统来捕获所有这些指标和事件,被脱落的软件基础设施和硬件基础设施,并将其存储在一个地方。现在,可以看到的是与基础设施发生的事情。如果发生的某些事是一个问题,还有就是它的一个意识和系统有它的记录。以这一步,它可能关联事件和指标,以了解为何SLA是或没有得到满足。

未来的趋势是对所有事物进行检测,当数据仍然有意义时,收集、分析和处理数据将需要时间序列数据库和相关工具(如流感数据平台)。

加入网络世界社区吧足球竞猜app软件脸谱网LinkedIn对大家最关心的话题发表评论。

版权所有©2018足球竞彩网下载

工资调查:结果是