#面试#一份说明可伸缩、高可靠和高性能的大规模系统模式的阅读清单。案例学习都是从服务于数百万甚至数亿用用户的线上系统总结的。
#数据库#ClickHouse是性能强悍、适合OLAP实时分析的列式数据库,支持SQL语法
#计算机科学#Python 数据科学学习笔记:深度学习 (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, 大数据 (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python 核心, AWS, Linux命令
#区块链#An open source cybersecurity protocol for syncing decentralized graph data.
翻译 - 实时,分散,离线优先的图形协议,用于同步Web。
Presto 是用于大数据的高性能分布式SQL查询引擎
The Data Engineering Cookbook
翻译 - 数据工程手册
PredictionIO, a machine learning server for developers and ML engineers.
A distributed, fast open-source graph database featuring horizontal scalability and high availability
翻译 - 具有水平可伸缩性和高可用性的分布式快速开源图形数据库
trino 是一个分布式大数据 SQL 查询引擎(前身 PrestoSQL)
#编程语言#The most widely used Python to C compiler
翻译 - 使用最广泛的Python到C编译器
#搜索#quickwit 是一个用于日志管理和分析的搜索引擎,是Datadog、Elasticsearch, Loki 和 Tempo 的替代品
StarRocks 是新一代极速全场景 MPP (Massively Parallel Processing) 数据库。StarRocks 的愿景是能够让用户的数据分析变得更加简单和敏捷。用户无需经过复杂的预处理,就可以用 StarRocks 来支持多种数据分析场景的极速分析。
#计算机科学#A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports computa...
翻译 - 快速,可扩展,高性能的“决策树加速梯度”库,用于对Python,R,Java,C ++进行排名,分类,回归和其他机器学习任务。支持在CPU和GPU上进行计算。
Delta Lake 是一个开源存储框架,可以使用 Spark、PrestoDB、Flink、Trino 和 Hive 等计算引擎以及适用于 Scala、Java、Rust、Ruby 和 Python 的 API 构建 Lakehouse 架构。