开源大数据应用平台专家并发已发布级联应用程序框架的新版本,并同时发布级联语言1.0,为Hadoop的ANI SQL接口。
建立上个月的释放Apache Hadoop 2.2,大数据应用平台专家同时今天发布了一个新版本级联,它的大数据应用框架。
“在我的生命中使用Mapreduce一次,我在常见的愤怒中创造了级联,并且owoy再次使用它。”- Chris Wesel,创始人和CTO并发。
并发还宣布了一般可用性级联语言1.0是一个开源项目,提供全面的ANSI SQL接口。
级联是一个独立的开源Java应用程序框架,被设计为映射到MapReduce的替代API。级联为Java开发人员提供了使用其现有技能集在Hadoop上构建大数据应用程序的功能。
“在我的生命中使用Mapreduce曾经使用过Mapreduce并从未再次使用它后,我在愤怒中创造了级联,”Chris Wensel,Cascading,创始人和CTO的Chris Wensel,CoS的创造者说。
最新版本,级联2.5增加了对Hadoop 2.2的支持,包括在Hadoop版本中引入的新纱线架构。Apache Hadoop纱线(又一资源谈判代理商)用作Hadoop操作系统,以单人使用数据平台进行批量处理,并将其演变为批量,交互式,在线和流处理的多用途平台。
Yarn作为主资源管理器和访问存储在Hadoop分布式文件系统(HDFS)中的数据的调解器,使企业能够在一个地方存储数据,然后同时以多种方式与其交互,以一致的服务级别.
企业现在可以使用级联来利用Java,传统的SQL和预测建模投资,以获得单一的大数据处理应用程序。
Hadoop 2的迁移路径2
并发首席执行官的Gary Nakamura表示,级联不专门利用纱线,但确实使用户能够将其应用程序无缝地将其应用程序迁移到Hadoop 2并利用纱线。域特定语言(DSL),如Scalding,Cascalog和PycascAding,也无缝地迁移到Hadoop 2.同样,级联将在Hadoop堆栈中占据其位置时支持Apache Tez。
同时还增加了复杂的加入操作和优化的性能改进,以便在HDFS上更有效地分区和存储已处理的数据。
除了级联外,并发宣布了级联的旋转曲线1.0的可用性,旨在帮助已经在商业智能(BI)工具中投入的企业,如Pentaho,Jaspersoft和Cognos - 以及与他们一起去的培训 - 快速访问他们Hadoop的数据。语言允许用户利用其现有的SQL技能和系统来在Hadoop上创建和运行应用程序。
Concurrent的Wesel表示,语言Empowers刚刚熟悉SQL的任何人,以便使用他们的JDBC标准的BI或桌面工具立即使用存储在Hadoop上的数据。
“级联是大数据应用程序开发生态系统的重要组成部分,并且语言是在亚马逊Web服务的亚马逊Elastic MapReduce(EMR)的史蒂夫·麦克弗森(EMR)中达到更容易构建大数据应用程序AWS)。
McPherson说:“现在,Amazon Elastic MapReduce的客户可以利用语种将亚马逊Web服务上不同的数据存储与Amazon S3和Amazon Redshift等服务集成起来,他们可以处理数据,并通过一个标准的ANSI SQL语句将其存储在Amazon EMR中。”“这让客户更容易使用他们喜欢的BI工具查询数据。”
Thor Olavsrud.涵盖IT安全、大数据、开源、微软工具和服务器。在推特上关注雷神@thorolavsrud..在Twitter上关注CIO.com上的一切@cioonline.那Facebook那谷歌+和linkedin.
阅读更多关于应用程序的信息在CIO的应用中钻取。
这个故事,“大数据应用程序框架获取更新,SQL接口”最初发布CIO. .