Hadoop Hive获得生产优化

最新发布的Hive 0.7.0增加了更多数据仓库友好的特性

随着企业软件的日益成熟,Hive数据仓库软件已经更新了一些新的功能,这些功能被认为是生产使用中必不可少的,比如索引、并发性和认证管理方面的进步。

Hadoop平台提供商Cloudera的副总裁Charles Zedlewski在接受电子邮件采访时说:“我们很高兴地看到,Hive在性能、安全性和可用性方面的进步,我们的企业客户和商业智能合作伙伴都能从中受益。”

Apache Hadoop数据处理框架的一个组件,Apache蜂巢是针对Hadoop文件系统中存储的大型数据集运行数据仓库式操作的开源软件。它提供数据摘要、特别查询和分析等操作。来自Cloudera、Facebook和其他公司的志愿者开发人员为代码库贡献力量。

最近,人们对Hadoop的兴趣越来越大,因为很多人把它看作是一个重要的工具用于分析大量数据

软件版本0.7.0发布周二是自去年10月发布0.6版本以来的第一次重大升级。

新发布的版本包含大量的新特性,其中许多在商业数据库和数据仓库中已经存在很长时间了。

其中一个新特性是索引。通过索引,可以创建数据集的摘要,系统可以使用它来加快查找和范围查询的处理速度。身份验证也得到了加强,允许Hive与来自其他存储库的授权信息集成。

Hive 0.7还提供了一个新的并发模型。以前版本的软件没有适当的保护措施,以防止系统更新数据的同时,数据正在读取系统的另一部分。因此,这个系统可能会返回不正确的数据。新的并发模型阻止访问此时正在更新的数据。

Hive版本0.7.0可与Hadoop 0.20.1和0.20.2兼容。

约押·杰克逊报道企业软件和通用技术的突发新闻IDG新闻服务。在推特上关注约押@Joab_Jackson。约押的电子邮件地址是Joab_Jackson@idg.com

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对最重要的话题发表评论。
相关:

版权©2011足球竞彩网下载

工资调查:结果在