HBase

HBase是一个分布式的、面向列的开源数据库，该技术来源于Chang et al所撰写的Google论文“Bigtable：一个结构化数据的分布式存储系统”。就像Bigtable利用了Googl文件系统（File System）所提供的分布式数据存储一样，HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop 项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式。 HBase使用和Bigtable非常相同的数据模型。用户存储数据行在一个表里。一个数据行拥有一个可选择的键和任意数量的列。表是疏松的存储的，因此用户可以给行定义各种不同的列。HBase主要用于需要随机访问，实时读写你的大数据（Big Data）。

Overview

The Approaching Storm by Constant Troyon, 1849 HBase is the Hadoop database. Use it when you need random, realtime read/write access to your Big Data. This project's goal is the hosting of very large tables -- billions of rows X millions of columns -- atop clusters of commodity hardware.

HBase ia an open-source, distributed, column-oriented store modeled after Google' Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable leverages the distributed data storage provided by the Google File System, HBase provides Bigtable-like capabilities on top of Hadoop. HBase also includes:

    * Convenient base classes for backing Hadoop MapReduce jobs with HBase tables
    * Query predicate push down via server side scan and get filters
    * Optimizations for real time queries
    * A high performance Thrift gateway
    * A REST-ful Web service gateway that supports XML, Protobuf, and binary data encoding options
    * Cascading source and sink modules
    * Extensible jruby-based (JIRB) shell
    * Support for exporting metrics via the Hadoop metrics subsystem to files or Ganglia; or via JMX

This most recent version of HBase, 0.20.0, has greatly improved on its predecessors:

    * No HBase single point of failure
    * Rolling restart for configuration changes and minor upgrades
    * Random access performance on par with open source relational databases such as MySQL

【官方主页】

【下载地址】

网友留言/评论

我要留言/评论

相关开源项目

Emdros:Emdros是一个text数据库可以用来分析/注解(analyzed/annotated)文本.Emdros有自己的强大查询语言用来进行查询,新增,修改,删除操作.

db4o:完全原生于Java和.NET 100% 面向对象, 抛开对象-关系映射为嵌入式应用优化开源,可以基于GPL协议免费使用.
中文资源社区：http://www.db4o.com/china?src=cn

hamsterdb-java:hamsterdb-java是hamsterdb嵌入式数据库的一个Java封装。hamsterdb是一个采用C开发，非常快，轻量级的嵌入式数据库引擎。

eXist:eXist是一个开源的native XML数据库.它有依据索引的XQuery处理程序,可以自动进行索引,扩展的全文本搜索,XUpdate支持并且它与现存的XML开发工具可以紧密的结合在一起.

Ozone:ozone是一个面向对象的数据库管理系统完全用Java实现.ozone项目的目的是让开发者可以构建一个纯面向对象,纯Java的数据库应用程序.ozone还可以用来存储XML,可以用任XML工具来访问这些数据.

HeliDB:HeliDB是一个简单、快速的数据库，用于存储来自Java程序的key—value成对数据。可以通过配置来使该数据库支持不同的功能和存储方式。最简单的配置情况下，该数据库只是一个基于文件的Map，更复杂的配置，该数据库将使用B+树数据结构来提供快速搜索、新增和事务支持。

FlockDB: FlockDB是一个存储图数据的分布式数据库，图数据库的存储对象是数学概念图论里面的图，而非图片。Twitter使用它来存储人与人之间的关系图，这些关系包括：你在关注谁，谁在关注你，谁给你留了电话提醒等。FlockDB可用于支持：高速增/册/改操作。在线数据迁移。对包含数百万条目的查询结果进行分页。超大规模邻接矩阵查询。将数据进行归档，允许之后被恢复。

NeoDatis ODB:NeoDatis ODB是一个面向对象数据库，一个真正透明的对象持久层。利用一行简单的代码就能够持久化native object。ODB非常简单、非常快并自带强大查询语言。ODB既可以做为一个内嵌数据库引擎使用，也可以以C/S模式运行。

Mckoi DataBase:McKoiDB 是GPL 的license, 是由纯Java开的数据库。他的 JDBC Driver 是使用 JDBC version 3 的 Spec. 他也是遵循 SQL-92 的标准, 也尽量支持新的 SQL 特色, 并且支持 Transaction 的功能.

Apache Xindice:Apache Xindice也是一个Native-XML数据库(NXD).Xindice 提供了命令行界面来管理数据库。Xindice使用XPath做为它的查询语言与XML:DB XUpdate做为它的更新语言.