新的Cassandra可以将20亿列压缩到一行中

Apache刚刚发布的Cassandra 0.7提供了大数据支持

Cassandra分布式数据库背后的志愿开发人员已经发布了他们的开源软件的最新版本,能够容纳每行20亿列。

Apache Software Foundation项目背后的开发人员断言,对于大数据、云计算项目和大型Web应用程序来说,能够保存如此长的行的开放源码数据库最有用。

Apache Cassandra副总裁、Cassandra专业支持公司Riptano的联合创始人Jonathan Ellis在一份声明中说:“Apache Cassandra是云计算和其他处理海量数据和高查询量的应用程序中的关键组件。”“它特别成功地为高速增长的大型网站提供了动力。”

许多大型Web服务都使用了这个数据库,包括Digg、Twitter和Facebook,后者最先开发了这项技术。根据该项目,最大的Cassandra集群运行在400多个服务器上。

的新安装的大行支持特性卡桑德拉0.7版本允许数据库每行容纳最多20亿列。以前的版本没有设置上限,尽管可以在单个行中保存的最大材料量约为2GB。这个上限已被取消。

Ellis在后续的电子邮件中解释说,创建这么多专栏的能力是很有价值的,因为它允许系统在运行中创建几乎无限数量的专栏。

计算机科学家Maxim Grinev详细阐述了,因为Cassandra不能执行SQL查询命令,所以需要额外的列来分析特定行的数据在最近的一篇博客中

0.7的其他新特性包括附加二级索引(它提供了在本地机器上查询数据的简单方法),以及无需重新启动整个集群就可以修改模式的能力。

Cassandra是非关系型的一种NoSQL数据库提供了快速、轻松存储大量数据的能力,通常在集群环境中,

社交网络巨头Facebook发达Cassandra的收件箱搜索功能。由于需要组织大量的数据,Facebook想要使用谷歌大表数据库设计,它可以提供面向列和行的数据库结构,可以跨多个节点分布。

去年11月在亚特兰大举行的ApacheCon会议上,Ellis在接受IDG新闻服务的采访时说,“大桌子”的局限在于它是一个主控节点导向的设计。整个操作依赖于单个节点来协调跨所有其他节点的读写活动。换句话说,如果头节点宕机,整个系统就会瘫痪,Ellis说。

Cassandra是用Amazon架构构建的发电机,结合大表。发电机消除了单点故障,同时允许容易的可伸缩性。发电机设计不依赖于任何一个主节点。任何节点都可以接受整个系统的数据,并回答查询。数据在多台主机之间复制。

Cassandra并不是唯一基于Big Table和Dynamo思想构建的集群数据库。数据库启动公司Cloudant使用这种组合开发了开源数据库CouchDB的集群版本,叫BigCouch。Cloudant公司刚刚宣布,BigCouch的托管服务已经积累了2500名用户。

约押·杰克逊报道企业软件和通用技术的突发新闻IDG新闻服务。在推特上关注约押@Joab_Jackson。约押的电子邮件地址是Joab_Jackson@idg.com

加入网络世界社区足球竞猜app软件脸谱网LinkedIn对最重要的话题发表评论。
相关:

版权©2011足球竞彩网下载

工资调查:结果在