Apache Flink 是高效和分布式的通用数据处理平台
最近更新:
5小时前
Apache NiFi is an easy to use, powerful, and reliable system to process and distribute data.
最近更新:
5小时前
Atlas 是一个可伸缩和可扩展的核心功能治理服务。企业可以利用它高效的管理 Hadoop 以及整个企业数据生态的集成
最近更新:
5小时前
Apache POI是基于Office Open XML标准(OOXML)和Microsoft的OLE 2复合文档格式(OLE2)处理各种文件格式的开源项目
最近更新:
5小时前
Apache Spark - A unified analytics engine for large-scale data processing
最近更新:
5小时前
kafka是一种高吞吐量的分布式发布订阅消息系统
最近更新:
5小时前
PDFBox是Java实现的PDF文档协作类库,提供PDF文档的创建、处理以及文档内容提取功能,也包含了一些命令行实用工具
最近更新:
1天前
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等
最近更新:
1天前
Tika 是一个内容抽取的工具集合(a toolkit for text extracting)。它集成了 POI, Pdfbox 并且为文本抽取工作提供了一个统一的界面。
最近更新:
1天前
Dubbo 是一个高性能优秀的服务框架,使得应用可通过高性能的 RPC 实现服务的输出和输入功能,可以和 Spring 框架无缝集成
最近更新:
1天前
The Apache Commons IO library contains utility classes, stream implementations, file filters, file comparators, endian transformation classes, and ...
最近更新:
1天前
Commons项目中用来处理Java基本对象方法的工具类包,可以简化很多平时经常要用到的写法,例如判断字符串是否为空等等。
最近更新:
2天前
commons-beanutils 是apache commons子项目中的一个软件包,其主要目的是利用反射机制对JavaBean的属性进行处理
最近更新:
2天前
Collection of network utilities and protocol implementations. Supported protocols include: Echo, Finger, FTP, NNTP, NTP, POP3(S), SMTP(S), Telnet, ...
最近更新:
2天前
contains types that extend and augment the Java Collections Framework.
最近更新:
2天前
Hive是一个基于Hadoop的数据仓库平台
最近更新:
2天前
NetBeans 是开源软件开发集成环境,是一个开放框架,可扩展的开发平台,可以用于 Java,C/C++,PHP 等语言的开发,本身是一个开发平台,可以通过扩展插件来扩展功能
最近更新:
3天前
项目主要目标是创建一些可伸缩的机器学习算法
最近更新:
3天前
Apache Zeppelin 是一个让交互式数据分析变得可行的基于网页的开源框架。Zeppelin提供了数据分析、数据可视化等功能
最近更新:
3天前