一个非常快的 DataFrame 库,支持 Rust、Python、Node.js
Apache Arrow 是用于内存分析的开发平台,支持多语言。包含一个标准化的物件栏内存格式,且能够表示平面及层级化数据,以便在现代CPU和GPU硬体上进行高效率的分析操作。
DataFusion 是一个可扩展的查询执行框架,用Rust 编写,使用Apache Arrow 作为其内存格式
Create full-fledged APIs for slowly moving datasets without writing a single line of code.
LakeSoul is an end-to-end, realtime and cloud native Lakehouse framework with fast data ingestion, concurrent update and incremental data analytics on cloud storages for both BI and AI applications.
Distributed compute platform implemented in Rust, and powered by Apache Arrow.
翻译 - 使用Apache Arrow内存模型在Rust中实现的分布式计算平台。
Apache DataFusion Ballista Distributed Query Engine
Apache DataFusion Comet Spark Accelerator
Rust-based WebAssembly bindings to read and write Apache Parquet data