Apache Spark - A unified analytics engine for large-scale data processing
最近更新:
20小时前
kafka是一种高吞吐量的分布式发布订阅消息系统
最近更新:
20小时前
Apache Flink 是高效和分布式的通用数据处理平台
最近更新:
20小时前
Hudi 于 2016 年以“Hoodie”为代号开发,旨在解决 Uber 大数据生态系统中需要插入更新及增量消费原语的摄取管道和 ETL 管道的低效问题
最近更新:
20小时前
Apache Griffin是一个应用于分布式数据系统中的开源数据质量解决方案
最近更新:
5天前
Apache Mnemonic 是一个面向非易失性混合内存存储的库,它提出了一个非易失性/持久的 Java 对象模型和持久的计算服务,能显着提高了海量实时数据处理/分析的性能
最近更新:
8天前
Apache Toree 提供了与远程 Apache Spark 进行交互和访问的机制
最近更新:
2个月前
IoTDB是针对时间序列数据收集、存储与分析一体化的数据管理引擎,主要用于物联网
最近更新:
8个月前
Apache Streams 是一个实现了 ActivityStreams 技术的轻量级框架
最近更新:
10个月前