Apache Spark is an open source distributed general-purpose cluster-computing framework. It provides an interface for programming entire clusters with implicit data parallelism and fault tolerance.
Created by Matei Zaharia
发布于 May 26, 2014
flink learning blog. http://www.54tianzhisheng.cn/ 含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。涉及 Flink Connector、Metrics、Library、DataStream API、Table API & SQL 等内容的学习案例,还有 Flink 落地应用的大型项目案例(PVUV、日志存储、百亿数据实时去重、...
【大厂面试专栏】一份Java程序员需要的技术指南,这里有面试题、系统架构、职场锦囊、主流中间件等,让你成为更牛的自己!
Deeplearning4j 是为Java以及基于JVM编写的开源深度学习库,是广泛支持各种深度学习算法的运算框架。
Delta Lake 是一个开源存储框架,可以使用 Spark、PrestoDB、Flink、Trino 和 Hive 等计算引擎以及适用于 Scala、Java、Rust、Ruby 和 Python 的 API 构建 Lakehouse 架构。
Alluxio作为数据编排层为大数据和人工智能工作负载带来速度和敏捷性并降低成本,使用户能够迁移到对象存储等更新的存储解决方案
#计算机科学# A Flexible and Powerful Parameter Server for large-scale machine learning
翻译 - 灵活而强大的参数服务器,用于大规模机器学习
#计算机科学# Simple and Distributed Machine Learning
#自然语言处理# State of the Art Natural Language Processing
翻译 - 最先进的自然语言处理
🔨 用 JSON 来生成结构化的 SQL 语句,基于 Vue3 + TypeScript + Vite + Ant Design + MonacoEditor 实现,项目简单(重逻辑轻页面)、适合练手~
Linkis 在上层应用和底层引擎之间构建了一层计算中间件。通过使用Linkis 提供的REST/WebSocket/JDBC 等标准接口,上层应用可以方便地连接访问Spark, Presto, Flink 等底层引擎,同时实现跨引擎上下文共享、统一的计算任务和引擎治理与编排能力
DataSphereStudio is a one stop data application development& management portal, covering scenarios including data exchange, desensitization/cleansing, analysis/mining, quality measurement, visualizati...
翻译 - DataSphereStudio是一站式数据应用程序开发和管理门户,涵盖了各种场景,包括数据交换,脱敏/清理,分析/挖掘,质量测量,可视化和任务调度。
Kubernetes operator for managing the lifecycle of Apache Spark applications on Kubernetes.
翻译 - Kubernetes运算符,用于管理Kubernetes上Apache Spark应用程序的生命周期。