#计算机科学# MLflow 是一个开源框架,旨在管理整个机器学习生命周期。 它可以在不同的平台上训练模型并为模型提供服务,让你能够使用相同的一组工具,而不管试验是在计算机本地、远程计算目标上、虚拟机上
Kubernetes operator for managing the lifecycle of Apache Spark applications on Kubernetes.
翻译 - Kubernetes运算符,用于管理Kubernetes上Apache Spark应用程序的生命周期。
BigDL: Distributed TensorFlow, Keras and PyTorch on Apache Spark/Flink & Ray
翻译 - Apache Spark上的分布式Tensorflow,Keras,PyTorch和BigDL
A cluster computing framework for processing large-scale geospatial data
翻译 - 用于处理大规模空间数据的集群计算系统
An end-to-end GoodReads Data Pipeline for Building Data Lake, Data Warehouse and Analytics Platform.
翻译 - 用于构建数据湖,数据仓库和分析平台的端到端GoodReads数据管道。
PySpark Cheat Sheet - example code to help you learn PySpark and develop apps faster
翻译 - PySpark 备忘单 - 学习 PySpark 并更快地开发应用程序
Scalable Data Science, course sets in big data Using Apache Spark over databricks and their mathematical, statistical and computational foundations using SageMath.
翻译 - 可扩展数据科学,大数据中的课程设置使用Apache Spark覆盖数据块及其使用SageMath的数学,统计和计算基础。