• HBase


    HBase是一个分布式的、面向列的开源数据库,该技术来源于Chang et al所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Googl文件系统(File System)所提供的分布式数据存储一样,HBase在Hadoop之上提供了类似于Bigtable的能力。HBase是Apache的Hadoop 项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库.另一个不同的是HBase基于列的而不是基于行的模式。 HBase使用和Bigtable非常相同的数据模型。用户存储数据行在一个表里。一个数据行拥有一个可选择的键和任意数量的列。表是疏松的存储的,因此用户可以给行定义各种不同的列。HBase主要用于需要随机访问,实时读写你的大数据(Big Data)。

    Overview

    The Approaching Storm by Constant Troyon, 1849 HBase is the Hadoop database. Use it when you need random, realtime read/write access to your Big Data. This project's goal is the hosting of very large tables -- billions of rows X millions of columns -- atop clusters of commodity hardware.

    HBase ia an open-source, distributed, column-oriented store modeled after Google' Bigtable: A Distributed Storage System for Structured Data by Chang et al. Just as Bigtable leverages the distributed data storage provided by the Google File System, HBase provides Bigtable-like capabilities on top of Hadoop. HBase also includes:

        * Convenient base classes for backing Hadoop MapReduce jobs with HBase tables
        * Query predicate push down via server side scan and get filters
        * Optimizations for real time queries
        * A high performance Thrift gateway
        * A REST-ful Web service gateway that supports XML, Protobuf, and binary data encoding options
        * Cascading source and sink modules
        * Extensible jruby-based (JIRB) shell
        * Support for exporting metrics via the Hadoop metrics subsystem to files or Ganglia; or via JMX

    This most recent version of HBase, 0.20.0, has greatly improved on its predecessors:

        * No HBase single point of failure
        * Rolling restart for configuration changes and minor upgrades
        * Random access performance on par with open source relational databases such as MySQL

    点击次数   官方主页【官方主页】   下载地址【下载地址】

    网友留言/评论

    我要留言/评论

    相关开源项目

    Emdros:Emdros是一个text数据库可以用来分析/注解(analyzed/annotated)文本.Emdros有自己的强大查询语言用来进行查询,新增,修改,删除操作.
    db4o:完全原生于Java和.NET 100% 面向对象, 抛开对象-关系映射 为嵌入式应用优化 开源,可以基于GPL协议免费使用.
    中文资源社区:http://www.db4o.com/china?src=cn
    hamsterdb-java:hamsterdb-java是hamsterdb嵌入式数据库的一个Java封装。hamsterdb是一个采用C开发,非常快,轻量级的嵌入式数据库引擎。
    eXist:eXist是一个开源的native XML数据库.它有依据索引的XQuery处理程序,可以自动进行索引,扩展的全文本搜索,XUpdate支持并且它与现存的XML开发工具可以紧密的结合在一起.
    Ozone:ozone是一个面向对象的数据库管理系统完全用Java实现.ozone项目的目的是让开发者可以构建一个纯面向对象,纯Java的数据库应用程序.ozone还可以用来存储XML,可以用任XML工具来访问这些数据.
    HeliDB:HeliDB是一个简单、快速的数据库,用于存储来自Java程序的key—value成对数据。可以通过配置来使该数据库支持不同的功能和存储方式。最简单的配置情况下,该数据库只是一个基于文件的Map,更复杂的配置,该数据库将使用B+树数据结构来提供快速搜索、新增和事务支持。
    FlockDB: FlockDB是一个存储图数据的分布式数据库,图数据库的存储对象是数学概念图论里面的图,而非图片。Twitter使用它来存储人与人之间的关系图,这些关系包括:你在关注谁,谁在关注你,谁给你留了电话提醒等。FlockDB可用于支持:高速增/册/改操作。在线数据迁移。对包含数百万条目的查询结果进行分页。超大规模邻接矩阵查询。将数据进行归档,允许之后被恢复。
    NeoDatis ODB:NeoDatis ODB是一个面向对象数据库,一个真正透明的对象持久层。利用一行简单的代码就能够持久化native object。ODB非常简单、非常快并自带强大查询语言。ODB既可以做为一个内嵌数据库引擎使用,也可以以C/S模式运行。
    Mckoi DataBase:McKoiDB 是GPL 的license, 是由纯Java开的数据库。他的 JDBC Driver 是使用 JDBC version 3 的 Spec. 他也是遵循 SQL-92 的标准, 也尽量支持新的 SQL 特色, 并且支持 Transaction 的功能.
    Apache Xindice:Apache Xindice也是一个Native-XML数据库(NXD).Xindice 提供了命令行界面来管理数据库。Xindice使用XPath做为它的查询语言与XML:DB XUpdate做为它的更新语言.