NoSQL的隐藏成本

NoSQL是一种功能强大的数据模型,但可能不足以证明存在许多独立的数据存储。

NoSQL的隐藏成本
思想库

这本由供应商编写的技术入门读物由Network World编辑,以消除产品促销,但读者应该注意,它可能足球竞猜app软件会支持提交者的方法。

NoSQL行业在无模式设计、无限可扩展集群和突破性性能的承诺下迅速发展。但也有隐藏的成本,包括无尽的数据存储选择增加了复杂性(现在编号225),意识到没有SQL的分析是痛苦的,高查询延迟要求您预计算结果,低效率的硬件使用导致服务器蔓延。

所有这些成本加在一起,最终形成的局面远没有最初设想的那么乐观。但是,NoSQL的数据模型对于跨键值和文档数据类型的某些工作负载是有意义的。幸运的是,这些数据现在被合并到多模式和多模型数据库中,代表了一种简化和统一的数据管理方法。

让我们仔细看看NoSQL运动的动力以及放弃SQL的真正影响。

NoSQL运动的黎明和衰落

NoSQL的流行源于需要扩展到传统的基于磁盘的关系数据库所能处理的范围之外,并且因为大型数据库公司的高性能解决方案很快变得非常昂贵。随着数据的增长,开发人员需要一种更好的方式来越来越多地使用简单的数据结构,如与移动应用程序相关的用户和配置文件信息。NoSQL承诺了一条实现性能的捷径。

NoSQL流行的另一个原因是人们认为SQL很难学。但是Puppet Labs的工程总监Michael Stahnke声称这是一个早期且无效的论点,他指出,“相反,你必须为你使用的每个工具学习一种查询语言。”

近年来发生了一些变化,导致NoSQL被广泛应用于数据库市场。

首先,内存中的体系结构已经证明,可以将性能和SQL结合在一起,解决了最初放弃SQL的部分原因。

其次,大多数NoSQL数据存储都是从一种有限的语言开始的,用于键值/值工作负载,然后尝试更多类似SQL的构造,甚至尝试重新创建SQL本身。从SQL开始意味着您将集成多版本并发控制(MVCC)或索引等核心体系结构功能,这两种功能对于不断变化的数据集的实时分析都至关重要。

最后,关系数据库供应商已经认识到多个数据模型的价值,并将它们合并到一个全面的产品中。

也许领先的分析公司Gartner对NoSQL逐渐消失的现象进行了最好的总结:“到2017年,‘NoSQL’标签将不再区分DBMS,这将降低其价值并导致其不再使用”(如中所述)Dataversity).

SQL的价值

具有讽刺意味的是,随着NoSQL的大肆宣传,sql作为一层的价值对公司和数据存储都立即变得有价值。看看sql作为一层从Hadoop中拯救数据的努力,比如Impala (Cloudera)、Drill (MapR)和Hive (Hortonworks)等项目,以及Facebook开发的Presto等解决方案。

而像Spark这样的处理框架,凭借其流行的Spark SQL功能,已经被证明是文档和键值数据存储的一个节省,而SQL则被搁置在了削减空间。

同时,在内存中,分布式系统可以使关系模型保持完整,实现突破性的性能和现代工作负载的可扩展性,并合并诸如JSON之类的NoSQL数据类型。

长寿命多模型数据库

当然,NoSQL标签的消亡并不意味着NoSQL模型的消亡。相反,它指出在一个数据库中使用多个数据模型。最近在一份报告中概述了这一点Matt Aslett的网络广播,451 research的数据平台和分析研究总监物联网和多模型数据基础设施,其中他指出:

  • 数据库市场已经被关系数据库模型(和SQL)统治了40年——通常使用独立的数据库来处理操作和分析工作负载。
  • 新兴数据库利用内存和高级处理性能,提供组合的操作和分析处理。
  • 多语言持久性推动了NoSQL数据库市场的扩展——用于特殊目的的专门数据库和多种数据模型。
  • 使用多个数据库来支持单个应用程序可能会导致操作复杂性和由相互依赖性驱动的不灵活性。
  • 多模型通过支持多个数据模型,实现了多语言持久性的灵活性,而不存在操作复杂性。

演示展示了多模型、多模式数据库如何支持SQL和NoSQL数据模型的组合,特别是JSON和键值,以及其他工作负载。

010516 nosql 1

计算隐藏成本

因此,虽然NoSQL承诺以更低的成本实现规模和性能,但NoSQL的部署实际上可能比最初想象的要昂贵得多。让我们看看一些隐藏的成本区域。

*增加了复杂性。正如451 Research的Aslett所提到的,“使用多个数据库支持单个应用程序会导致操作复杂性。”

每一个新的数据存储都会增加数据团队的财务和运营负担。必须支持更多只满足特定工作负载的数据库会增加成本。

*缺乏分析。由于放弃了SQL中隐含的关系代数,NoSQL存储在分析方面面临着一场艰苦的战斗。许多NoSQL存储实现了类似sql的查询层,比如针对Couchbase的Cassandra查询语言(CQL)或N1QL。这些工具提供了一些分析功能,但它们与ANSI SQL不同,而且它们使这些数据存储无法与使用SQL的企业工具进行本地连接。这种分歧可能对试图围绕SQL等开放标准进行设计的企业产生负面影响。

我在撰写本文的同时与一位终端用户进行的对话代表了NoSQL分析的困境。

010516 nosql 2

*查询延迟。复杂的分析对于NoSQL数据存储来说是一个挑战,因此许多公司不得不预先计算结果。Tapjoy发现这是HBase的情况,并概述了他们在旧金山内存计算会议期间面临的挑战。构建数据科学平台的搭便车指南演示文稿。此批处理工作流引入了系统延迟,并降低了数据的业务价值。不要介意,面向批处理的工作流意味着结果本身就过时了,并取消了提供实时分析的机会。

*硬件扩张。虽然规模(特别是集群中的节点数量)是一种荣誉,但目标不是部署多少节点,而是部署多少节点。更重要的是每个节点事务的效率。当NoSQL解决方案需要与额外的SQL层耦合,或者必须在查询运行之前完成预计算时,就会增加硬件扩展和成本。

*保留模型,合并工作量。还有其他的选择,最近被Gartner称为关系数据库的“前卫”提供使用SQL关系属性的解决方案,以及扩展所需的性能,通常通过使用内存技术。许多这些前卫数据库还包含JSON等功能,为结构化和半结构化数据提供数据模型。

如今,客户发现,NoSQL看似新颖的低成本解决方案,实际上比最初想象的要高得多。幸运的是,这些挑战可以通过一个数据库来解决,该数据库可以在一个解决方案中提供所需的性能和执行全面SQL分析的能力。

许多大数据行业参与者都注意到,公司捕获和处理数据的方式正在发生一场革命。但大数据著名发言人格温·沙皮拉(Gwen Shapira)或许可以最好地总结一下这种情况:

这条推文让我们看到了NoSQL运动。虽然无模式数据管理选项似乎为未来提供了一种灵丹妙药,但现实情况却大不相同,许多人认识到结构、模式和SQL的价值是经过时间考验的。

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对自己最关心的话题发表评论。

版权所有©2016足球竞彩网下载

资讯科技薪酬调查:结果是令人满意的