数据如何改变数据库景观

从NoSQL到Newsql到'数据代数'及以后,创新即将到来快速和愤怒

大数据(4)
IDG新闻服务

提到“数据库”这个词,大多数人都会想到已经占据了景观30多年的古老的RDBM。但是,这可能很快就会改变。

整个新的竞争者现在正在争夺这一关键企业市场,而他们的方法是多元化的,最多是共同的一件事:对大数据的剃刀尖锐。

驾驶这一新的替代品的大部分是什么是通常被称为“三维”潜在的大数据:体积,速度和品种。

基本上,今天的数据越来越快,比以往任何时候都更快地进入更多的数量;它也更多样化。它是一个新的数据世界,换句话说,传统的关系数据库管理系统并不是真正为它设计的。

“基本上,他们不能扩展到大,或快速或多样化的数据,”Kdnuggets总裁Gregory Piatetsky-Shapiro表示,分析和数据科学咨询公司。

这就是最近发现的Harte Hanks。截至2013年左右,营销服务机构正在使用不同数据库的组合,包括Microsoft SQL Server和Oracle Real Application Clusters(RAC)。

“我们注意到,随着数据的增长随着时间的推移,我们的系统无法足够快地处理信息,”公司的技术和发展负责人Sean Iannuzzi说。“如果你继续购买服务器,你只能继续前进。我们想确保我们有一个可以向外扩展的平台。”

Iannuzzi说,最大限度地减少中断是一个关键目标,所以“我们不仅仅是切换到Hadoop。”

相反,它选择了拼接机,它基本上在流行的Hadoop大数据平台上施加了完整的SQL数据库,并允许现有的应用程序与之连接。

Harte Hanks现在处于实施的早期阶段,但它已经看到了福利,Iannuzzi表示,包括改善的容错,高可用性,冗余,稳定性和“整体性能提升”。

IDC的研究副总裁Carl Olofson表示,有一种完美的风暴推动新数据库技术的出现。

首先,“我们使用的设备更能力快速,灵活地处理大量数据收集,而不是过去,”Olofson指出。

他解释说,在过去的旧时代,这种系列“几乎必须放在​​旋转磁盘上”,数据必须以特定方式构建。

现在有64位的可寻址性,使得可以设置较大的内存空间,以及更快的网络和能力将多台计算机一起串联,以充当单个大型数据库。

“那些事情已经开辟了不可用的可能性,”奥洛森说。

与此同时,工作负载也发生了变化。虽然10年前,网站在很大程度上是静态的,例如,今天我们拥有Live Web服务环境和互动购物体验。他说,又需要新的可扩展性水平。

公司也在新的方式使用数据。而传统上,我们的大部分焦点都在处理交易 - 记录我们销售的多么销售,并将该数据存储在可以分析的地方 - 今天我们正在进行更多。

应用国家管理是一个示例。

说你正在玩在线游戏。该技术必须记录您对系统的每个会话,并将它们连接在一起以呈现连续体验,即使您切换设备或由不同服务器处理的各种移动,Olofson解释说明。

必须持久地进行数据,以便公司可以分析例如“为什么没有人交叉晶室”的问题。在网上购物背景中,一个对手可能是为什么更多人在点击颜色选择后没有购买特定品牌的鞋子。

“之前,我们没有试图解决这些问题,或者 - 如果我们是 - 我们试图将它们挤进一个不太适合的盒子里,”奥洛森说。

Hadoop是当今新竞争者中的重量级。虽然它不是数据库本身,但它已经成长为解决大数据的公司的关键作用。基本上,Hadoop是一种用于运行高度并行化应用的数据为中心的平台,它非常可扩展。

通过允许公司通过额外的昂贵服务器来扩展分布式时装的“out”,而不是缩放“向上缩放”,“它使得可以非常便宜地放在一起大型数据收集,然后看看你所拥有的东西,”奥洛夫森说。

其他新的RDBMS替代品是NoSQL.家庭的产品系列,包括MongoDB - 目前第四个最受欢迎的数据库管理系统,根据db-engines - 和marklogic。

“关系已经成为30年的伟大技术,但它建于不同的技术限制和不同的市场需求,”Marklogic副总裁Joe Pasqua说。

他说,大数据不是同质的,但在许多传统技术中,这仍然是一个根本的要求。

“想象一下你在笔记本电脑上的唯一节目是Excel,”Pasqua说。“想象一下你想跟踪朋友网络 - 或者你正在写一份合同。那些不适合行和列。”

组合数据集可以特别棘手。

“关系说,在将所有这些数据集中在一起之前,您必须决定如何将所有列排列在所有列中,”他添加。“我们可以采用任何格式或结构,并立即开始使用它。”

NOSQL数据库不使用关系数据模型,并且通常没有SQL接口。然而,许多NoSQL商店妥协有利于速度和其他因素的一致性,MarkLogic Biges自身提供作为企业量身定制的更加一致的志同道合的选择。

储藏店为诺斯克市场有相当大的增长,根据市场研究媒体,但并非每个人都认为这是正确的方法 - 至少在所有情况下都没有。

NoSQL Systems“解决了许多问题,以缩放架构,但他们扔掉了SQL,”拼接机的首席执行官Monte Zweben说。反过来,对现有代码构成问题。

拼接机是不同类别的替代品的示例newsql.- 另一个类别期待强劲增长未来几年。

“我们的哲学是保持SQL,但增加了比例横向架构,”Zweben说。“现在是新东西的时候了,但我们正在努力使人们不必重写他们的东西。”

深度信息科学也选择坚持SQL,但它需要另一种方法。

该公司的DeepSQL数据库使用与MySQL相同的应用程序编程接口(API)和关系模型,这意味着不需要使用申请更改以便使用它。但它使用机器学习以不同的方式解决数据。

DeepSQL可以使用任何工作量组合自动适应物理,虚拟或云主机,从而消除了对手动数据库优化的需求。

在公司的首席战略官员Chad Jones表示,结果是大大提高了绩效以及扩展到数十亿行的能力。“

一个完全不同的方法来自代数数据,这表示它已经开发了第一个真正的数据数学基础。

虽然计算机硬件在其构建之前在数学上进行了建模,但并非软件的情况并非如此,因此代数表示代数。

“软件,尤其是数据,从未建立在数学基础上,”他说。“软件在很大程度上是语言学问题。”

在5年的研发之后,Algebraix已经创造了它所谓的“数据代数”,即分散数学集理论的“一种普遍的数据语言”,Silver表示。

“大数据的肮脏小秘密是数据仍然位于没有其他数据的小筒仓中,”银说明。“我们已经证明它都可以在数学上代表,所以这一切都集成了。”

AlgeBraix现在配备了一个基础的平台,现在提供公司的业务分析作为服务。改善的性能,容量和速度都在福利代数承诺之中。

时间会告诉哪些新竞争者成功,但没有,但与此同时,甲骨文等长期领导者并不完全站立。

“软件是一种非常时尚的行业,”Oracle数据库服务器技术执行副总裁Andrew Mendelsohn说。“事情经常从流行的不受欢迎,再次受欢迎。”

他说,今天的许多初创公司“带回了一点抛光或旋转了同样的旧东西”。“这是一代新一代的孩子,来自学校和重塑事情。”

SQL是“唯一一个让商业分析师提出问题并获得答案的语言 - 他们不必是程序员,”孟德尔索赫恩说。“大市场将永远是关系。”

他说,对于新类型的数据,关系数据库产品进化以支持20世纪90年代的非结构化数据。2013年,Oracle的名称数据库在版本12C中添加了对JSON(JavaScript对象表示法)的支持。

Mendelsohn说,而不是需要不同类型的数据库,而不是需要不同类型的数据库,这更像是在行业的改变的商业模式的转变。

“云是每个人都将在哪里,它会扰乱这些小家伙,”他说。“大家伙已经在云端,所以这些小家伙的空间在哪里?

“他们会去亚马逊的云并与亚马逊竞争吗?”他加了。“这会很难。”

Oracle有“最广泛的云服务频谱,”Mendelsohn说。“我们对今天所定位的地方感到乐意。”

Rick Greenwald是Gartner的研究主任,倾向于采取类似的观点。

“更新的替代品并不像传统的RDBMSE那样稳定且坚固,”Greenwald说。“一些用例可以用新的竞争者解决,但不是全部,而不是一种技术。”

展望未来,Greenwald预计传统的RDBMS供应商可以感受到价格压力的增加,并为其产品添加新功能。“有些人将自由地将新竞争者带入其整体数据管理生态系统,”他说。

对于新人来说,一些将生存,他预测,但“许多人将被获得或耗尽资金。”

今天的新技术并不代表传统的RDBMSES的结束,“这是迅速发展自己的”,“IDC的Olofson商定。“rdbms是针对明确定义的数据需要的 - 总是将成为一个角色。”

但他说,一些较新的竞争者也会有一个职位,特别是作为事物互联网和新兴技术,如非易失性双型内存模块(nvdimm.)抓住。

Olofson补充说,需要许多需要众多解决方案的问题。“有很多有趣的东西。”

加入网络世界社区足球竞猜app软件Facebooklinkedin.评论是最重要的主题。
有关的:

版权所有©2015.足球竞彩网下载

IT薪水调查:结果是