streaming-data · GitHub Topics

#Awesome#A curated list of awesome big data frameworks, ressources and other awesomeness.

Awesome Lists bigdata data-warehouse data-analytics 数据可视化 data-stream 数据库数据科学 data distributed-database stream-processing streaming-data visualize-data

13.55 k

2 个月前

provectus / kafka-ui

UI for Apache Kafka。一个Kafak 图形化管理工具

kafka-ui kafka-brokers kafka kafka-streams kafka-client Open Source kafka-connect kafka-producer streams big-data apache-kafka cluster-management web-ui kafka-manager kafka-cluster streaming-data event-streaming Hacktoberfest

Java 10.6 k

9 个月前

johnkerl / miller

Miller is like awk, sed, cut, join, and sort for name-indexed data such as CSV, TSV, and tabular JSON

翻译 - Miller就像awk，sed，cut，join和对名称索引数据（例如CSV，TSV和表格JSON）进行排序

data-processing data-cleaning CSV csv-format streaming-data streaming-algorithms tsv JSON json-data data-reduction 统计 statistical-analysis DevOps devops-tools tabular-data 命令行界面 command-line-tools

Go 9.25 k

5 天前

redpanda-data / connect

Fancy stream processing made operationally mundane

翻译 - 普通任务和数据工程的声明式流处理

message-queue stream-processing streaming-data message-bus logs stream-processor cqrs event-sourcing Go kafka amqp rabbitmq nats etl data-engineering DataOps

Go 8.3 k

1 天前

MaterializeInc / materialize

Real-time Data Integration and Transformation: use SQL to transform, deliver, and act on fast-changing data.

翻译 - 流数据仓库

Rust 数据库 SQL streaming kafka distributed-systems postgresql-dialect materialized-view stream-processing PostgreSQL streaming-data operational-data-store data-store

Rust 5.95 k

3 小时前

online-ml / river

#计算机科学#🌊 Online machine learning in Python

翻译 - ：custard：Python中的在线机器学习

incremental-learning 机器学习 Python online-learning online-statistics 数据科学 streaming online-machine-learning streaming-data concept-drift real-time-processing stream-processing

Python 5.28 k

1 个月前

readysettech / readyset

Readyset is a MySQL and Postgres wire-compatible caching layer that sits in front of existing databases to speed up queries and horizontally scale read throughput. Under the hood, ReadySet caches the ...

caching caching-proxy 数据库 MySQL PostgreSQL Rust streaming-data SQL 后端 cache postgresql-database

Rust 4.93 k

3 天前

infinyon / fluvio

Lean and mean distributed stream processing system written in rust and web assembly. Alternative to Kafka + Flink in one.

cloud-native streaming Rust real-time Serverless stateful stream-processing WebAssembly data-integration data-flow distributed-systems event-driven-architecture stream-processing-engine data-pipelines streaming-data data-analytics

Rust 4.42 k

2 天前

piskvorky / smart_open

Utils for streaming large files (S3, HDFS, gzip, bz2...)

Python s3 hdfs boto streaming file streaming-data bz2 Hacktoberfest

Python 3.29 k

16 天前

memgraph / memgraph

Open-source graph database, tuned for dynamic analytics environments. Easy to adopt, scale and own.

graph-algorithms graph-database graph-analysis stream-processing streaming-data kafka-streams kafka cypher graph NoSQL opencypher

C++ 2.74 k

8 小时前

reugn / go-streams

A lightweight stream processing library for Go

翻译 - 流处理库

stream-processing pipeline etl kafka data-stream kafka-streams streams Redis Apache Pulsar data-pipeline streaming-data stream-processor WebSocket nats-streaming streaming-api windowing 低代码 workflow

Go 2.01 k

21 天前

pravega / pravega

Pravega - Streaming as a new software defined storage primitive

翻译 - Pravega-流式传输作为一种新的软件定义的存储原语

streaming streaming-data distributed-storage real-time-data data-ingestion

Java 2 k

1 个月前

bytewax / bytewax

#计算机科学#Python Stream Processing

Python stream-processing Rust data-engineering data-processing 数据科学 dataflow 机器学习 streaming-data

Python 1.71 k

17 天前

quixio / quix-streams

#计算机科学#Python Streaming DataFrames for Kafka

kafka Python stream-processing data-engineering 数据科学机器学习 streaming-data event-driven-architecture stream-processor

Python 1.35 k

2 天前

python-streamz / streamz

Real-time stream processing for python

streaming-data Python async real-time

Python 1.26 k

5 个月前

microsoft / Trill

Trill is a single-node query processor for temporal or streaming data.

翻译 - Trill是用于时间或流数据的单节点查询处理器。

streaming-data temporal-data

C# 1.25 k

1 年前

zpl-c / zpl

📐 Pushing the boundaries of simplicity

翻译 - 📐推动简单的界限

zpl helper header-only C C++json5-parser cross-platform 数学 tar threading thread-pool coroutines 命令行界面 hashing memory-allocation memory-management timer time streaming-data csv-parser

C 1.01 k

8 个月前

kafbat / kafka-ui

Open-Source Web UI for managing Apache Kafka clusters

apache-kafka big-data cluster-management event-streaming Hacktoberfest kafka kafka-brokers kafka-client kafka-cluster kafka-connect kafka-manager kafka-producer kafka-streams kafka-ui Open Source streaming-data streams web-ui foss

Java 982

2 天前

DoneDeal0 / superdiff

Superdiff provides a complete and readable diff for both arrays and objects. Plus, it supports stream and file inputs for handling large datasets efficiently, is battle-tested, has zero dependencies, ...

comparison comparison-tool diff json-diff Node.js React streaming streaming-data TypeScript

TypeScript 913

2 个月前

joshday / OnlineStats.jl

⚡ Single-pass algorithms for statistics

Julia 语言统计 big-data streaming-data

Julia 861

6 个月前