一个分布式易扩展的可视化DAG工作流任务调度系统。致力于解决数据处理流程中错综复杂的依赖关系,使调度系统在数据处理流程中开箱即用
Azkaban workflow manager.
翻译 - Azkaban工作流管理器。
DataSphereStudio is a one stop data application development& management portal, covering scenarios including data exchange, desensitization/cleansing, analysis/mining, quality measurement, visualizati...
翻译 - DataSphereStudio是一站式数据应用程序开发和管理门户,涵盖了各种场景,包括数据交换,脱敏/清理,分析/挖掘,质量测量,可视化和任务调度。
Taier is a big data development platform for submission, scheduling, operation and maintenance, and indicator information display
Schedulis is a high performance workflow task scheduling system that supports high availability and multi-tenant financial level features, Linkis computing middleware, and has been integrated into dat...
最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban进行定时任务的调度,使用技术:Java/Scala语言,Hadoop、Spark、Hive、Kafka、Flume、Azkab...
基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。
基于DataX的通用数据同步微服务,一个Restful接口搞定所有通用数据同步
📁 Extract, Transform, Load (ETL) 👷♂️ refers to a process in database usage and especially in data warehousing. This repository contains a starter kit featuring ETL rela...
Define and schedule workflow, support Flink Jar/SQL, ClickHouse/Hive/Mysql SQL, Shell, etc.