设为首页
·
加入收藏
首页
PHP项目
JAVA项目
AJAX项目
C#项目
Ruby/Rails项目
U/Linux项目
教程下载
技术文章
我要登陆
我要注册
您的帐号:
您的密码:
自动登录:
取消
不是吧,您还没注册?赶紧注册吧!
10秒钟闪电注册
我要登陆
我要登陆
我要注册
您的邮箱:
请将您的邮箱作为登录账号
您的昵称:
4~30个字符,可以为中文
登陆密码:
6~30个半角字符
确认密码:
请再次输入密码
验 证 码 :
取消
其它
Apache项目
ObjectWeb项目
其它项目
开源吧
>
JAVA开源项目
>
其它
>
ObjectWeb项目
JOTM
JOTM 是一个基于Java开放源代码的事务处理管理器。它遵循JTA APIs规范与Business Transaction Protocol(BTP)规范以提供了对Web Service的支持。
【官方主页】
【下载地址】
网友留言/评论
我要留言/评论
相关开源项目
Apache Tika
: Apache Tika是一个Java工具包用于利用现有的解析类库,从不同格式的文档中(例如HTML,PDF,Doc),检测和提取出元数据和结构化内容。 功能包括: 1.检测文档的类型,字符编码,语言,等其他现有文档的属性。2.提取结构化的文字内容。3.该项目的目标使用群体主要为搜索引擎以及其他内容索引和分析工具。目前支持的文档格式和对应的解析类库如下:
文档格式
相应的解析类库
HTML
TagSoup
XML
自定义
微软的Office文档
Apache POI
OpenDocument format (ODF)
自定义
PDF
Apache PDFBox
EPUB
自定义
Rich Text Format (RTF)
自定义
压缩文件格式(如 ar, cpio, tar, zip, gzip, bzip2等)
Apache组织的Commons Compress
Txt
ICU
音频格式
主要采用Java的标准图像处理包javax.sound
图像格式
Java的标准图像处理包javax.imageio, 以及 metadata-extractor软件包。
视频格式
目前只支持Flash格式。
Java类文件
自定义
邮件mbox文件格式
自定义
OpenCCM
:OpenCCM是CCM (CORBA Component Model)的一个开源实现. OpenCCM允许你设计,实现,编译,打包,聚集,部署,安装,配置,执行和管理基于分布式CORBA组件的应用程序.
Apache UIMA
: Apache UIMA 是UIMA定义的Apache开源实现。UIMA是一个用于分析非结构化内容(比如文本、视频和音频)的组件架构和软件框架实现。这个框架的目的是为非结构化分析提供一个通用的平台,从而提供能够减少重复开发的可重用分析组件。 UIMA 架构允许您轻松插入定制的分析组件,并将它们与其他组件合并。您的 UIMA 应用程序不需要知道分析组件共同合作生成结果的细节。集成和组织多个分析组件是 UIMA 框架的工作。 UIMA 应用程序可能分析纯文本并识别人员、位置和组织;它也可能识别关系,比如为谁工作或在什么地方工作。应用程序通常可以拆分成组件。例如 “语言识别” => “特定于语言的部分” => “句子范围检测” => “实体检测(人员/位置的名称等等)”。
Apache Pig
: Pig是一个基于Hadoop的大规模数据分析平台,它提供的SQL-LIKE语言叫Pig Latin,该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。
Pig的实现有5个主要的部分构成:如图所示:
1.Pig自己实现的一套框架对输入、输出的人机交互部分的实现,就是Pig Latin 。2.Zebra是Pig与HDFS/Hadoop的中间层、Zebra是MapReduce作业编写的客户端,Zerbra用结构化的语言实现了对hadoop物理存储元数据的管理也是对Hadoop的数据抽象层,在Zebra中有2个核心的类 TableStore(写)/TableLoad(读)对Hadoop上的数据进行操作。3.Pig中的Streaming主要分为4个组件: 1. Pig Latin 2. 逻辑层(Logical Layer) 3. 物理层(Physical Layer) 4. Streaming具体实现(Implementation),Streaming会创建一个Map/Reduce作业,并把它发送给合适的集群,同时监视这个作业的在集群环境中的整个执行过程。 4.MapReduce在每台机器上进行分布式计算的框架(算法)。5.HDFS最终存储数据的部分。
Commons Compress
: Commons Compress提供了一组API用于操作(解压/压缩)ar、cpio、tar、zip、gzip和bzip2等格式的文件。ZipArchiveEntry entry = new ZipArchiveEntry(name);entry.setSize(size);zipOutput.putArchiveEntry(entry);zipOutput.write(contentOfEntry);zipOutput.closeArchiveEntry();
Apache Chemistry
: Apache Chemistry是Content Management Interoperability Services (CMIS) 规范的一个开源实现。该项目当前由以下子项目组成:
OpenCMIS - CMIS Java客户端和服务器端类库
cmislib - CMIS Python客户端类库
phpclient - CMIS PHP客户端类库
DotCMIS - CMIS .NET客户端类库
Apache Directory Studio
: Apache Directory Studio是一个LDAP工具平台,支持连接到任何 LDAP服务器并进行管理和开发工作,但主要还是设计用于Apache Directory Server。功能包括:LDAP浏览器、LDIF编辑器、Schema编辑器、嵌入式 ApacheDS、ACI编辑器。
RUBiS
:平台基准的在线拍卖应用模板。
云计算客户端开发包:Libcloud
: Apache 网站的顶级项目,Libcloud是一个通用的云计算客户端开发包,Libcloud是许多流行的云服务提供商的标准客户端库,有Python和Java两种版本。以下是当前Java版对各云服务提供商的情况:
Apache Hadoop
:Apache Hadoop是一个用java语言实现的软件框架,在由大量计算机中运行海量数据的分布式计算,它可以让应用程序支持上千个节点和PB级 Hadoop是从google的MapReduce和Google文件系统的论文获得的灵 Hadoop是Apache的一线项目,开发和实用来自世界各地的社区,Yah 止最大的贡献者,并且Yahoo广泛使用它在搜索业务和广告业务上。IBM和联合就是使用的Hadoop,为大学的课程提供分布式计算。 Hadoop的创始人是Doug Cutting(目前在yahoo工作),关于hadoop Doug Cutting在它儿子画图时画了一只大象而获得的灵感。其实Doug C 的目的是想为Nutch搜索引擎提供分布式。 hadoop有三个子项目:Hadoop core,HBase, Zookeeper。
联系我们
|
关于开源
CopyRight © 2008-2010
www.kaiyuanba.cn
京ICP备10010536号