旨在消除一些繁重的数据工程任务,MAPR今天更新了它的Hadoop分配包括阿帕奇钻0.5。
钻取是一个用于自助服务数据探索的开源分布式ANSI SQL查询引擎 - 用于交互式查询大型数据集的Google Dremel系统的开源版本,这为其BigQuery服务提供了支持。Apache钻取项目的规定目的是使能够在几秒钟内处理鼠标的鼠标和数万亿的数据,而是能够扩展到10,000台服务器。
+ ALSO ON网足球竞猜app软件络世界9家Hadoop的企业,你应该知道+
钻取查询引擎提供以下功能:
- 由数据库管理员(DBA)无需干预探索其原生格式(包括木地板,JSON文件和HBase的表)的数据。
- 分析演变和从NoSQL数据存储等的MongoDB和在线REST API的半结构化/嵌套数据。
- 创建同时结合不同的Hadoop数据源,如文件,HBase的表和蜂巢表的查询。
- 重用现有的SQL技能,BI工具和Apache蜂巢部署。
“我们很高兴这一点,因为它真正开启了一个新时代的SQL-上的Hadoop,”杰克·诺里斯,首席营销官MAPR说。“在注重Hadoop的自助服务数据探索,不需要IT部门的参与。”
由于钻提供了运行SQL直接查询各种格式的能力,它可以被用来作为到达,不用花准备和管理模式,并建立ETL任务星期探索实时数据。通过这种方式,它提供了跨多个数据源的瞬间,自助服务数据探索。
“企业要提供对存储在Hadoop和NoSQL数据库,以更广泛的与现有的SQL分析能力的用户的数据,”马特阿斯莱特,研究总监,数据平台和分析,在451 Research称。“阿帕奇钻的为集中模式,也有复杂的数据结构,包括嵌套和重复领域区别于传统方法SQL-上的Hadoop NoSQL的数据集提供了访问Hadoop中的数据,而不需要的能力。”
“每一个其他SQL-上的Hadoop解决方案,无论是蜂巢或TEZ或你有什么,依赖于一个固定的模式,”诺里斯补充道。“无论你在谈论MapReduce的,蜂巢或一些其它的SQL-上的Hadoop解决方案,有做建模,数据转换,管道,以支持分析。钻的发现数据,而不必等待能力需要这个中间人该过程发生给你的速度和灵活性的优势。”
MAPR是包装钻出MAPR 4.0.1,今天还发布了。它的Hadoop发行版的新版本扩展了它的实时功能的使用情况,包括业务应用,互动查询和流处理。
新版本包括多个批处理框架,包括MapReduce的1.x和2.x(纱线系),以及火花(0.9和1.0.2)。它还支持五种SQL-上的Hadoop技术:蜂巢(0.11,0.12,0.13),钻(0.5),SparkSQL(1.0.2),帕拉(1.3.1),并与HP Vertica的认证集成。它增加了对HBase的(0.94.21,0.98.4)和MAPR-DB的NoSQL技术和三个机器学习和图形库中亨利马乌(0.8,0.9)的形式,MLLib(0.9,1.0.2)和GraphX支持。
托尔Olavsrud涵盖CIO.com的IT安全性,大数据,开源,Microsoft工具和服务器。关注Thor@ThorOlavsrud。遵循从Cio.com上的所有内容@CIOonline,Facebook的,谷歌+和LinkedIn。
这个故事,“MAPR旨在利用SQL-ON-Hadoop的一个新的水平”最初发表CIO 。