flink
Java

Apache Flink 是高效和分布式的通用数据处理平台

最近更新: 5小时前

NiFi
Java

Apache NiFi is an easy to use, powerful, and reliable system to process and distribute data.

最近更新: 5小时前

atlas
Java

Atlas 是一个可伸缩和可扩展的核心功能治理服务。企业可以利用它高效的管理 Hadoop 以及整个企业数据生态的集成

最近更新: 5小时前

poi
Java

Apache POI是基于Office Open XML标准(OOXML)和Microsoft的OLE 2复合文档格式(OLE2)处理各种文件格式的开源项目

最近更新: 5小时前

spark
Java

Apache Spark - A unified analytics engine for large-scale data processing

最近更新: 5小时前

kafka
Java

kafka是一种高吞吐量的分布式发布订阅消息系统

最近更新: 5小时前

lucene
Java

Lucene 的源码

最近更新: 5小时前

pdfbox
Java

PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具

最近更新: 1天前

OpenNLP
Java

OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等

最近更新: 1天前

tika
Java

Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。

最近更新: 1天前

dubbo
Java

Dubbo 是一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring 框架无缝集成

最近更新: 1天前

Commons IO
Java

The Apache Commons IO library contains utility classes, stream implementations, file filters, file comparators, endian transformation classes, and ...

最近更新: 1天前

commons-lang
Java

Commons项目中用来处理Java基本对象方法的工具类包,可以简化很多平时经常要用到的写法,例如判断字符串是否为空等等。

最近更新: 2天前

commons-beanutils
Java

commons-beanutils 是apache commons子项目中的一个软件包,其主要目的是利用反射机制对JavaBean的属性进行处理

最近更新: 2天前

commons-net
Java

Collection of network utilities and protocol implementations. Supported protocols include: Echo, Finger, FTP, NNTP, NTP, POP3(S), SMTP(S), Telnet, ...

最近更新: 2天前

Commons Collections
Java

contains types that extend and augment the Java Collections Framework.

最近更新: 2天前

hive
Java

Hive是一个基于Hadoop的数据仓库平台

最近更新: 2天前

NetBeans
Java

NetBeans 是开源软件开发集成环境,是一个开放框架,可扩展的开发平台,可以用于 Java,C/C++,PHP 等语言的开发,本身是一个开发平台,可以通过扩展插件来扩展功能

最近更新: 3天前

Mahout
Java

项目主要目标是创建一些可伸缩的机器学习算法

最近更新: 3天前

zeppelin
Java

Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的开源框架。Zeppelin提供了数据分析、数据可视化等功能

最近更新: 3天前

搜索帮助