Data science is an inter-disciplinary field that uses scientific methods, processes, algorithms, and systems to extract knowledge from structured and unstructured data. Data scientists perform data analysis and preparation, and their findings inform high-level decisions in many organizations.
Apache Superset 是一个企业级数据可视化和数据分析的平台。
#计算机科学# Keras是一个基于 Python 的深度学习库,能够在TensorFlow、Microsoft Cognitive Toolkit、Theano或PlaidML之上运行。
#计算机科学# scikit-learn 是基于 SciPy、NumPy、matplotlib 构建的 Python 机器学习框架
Pandas 是一个灵活、强大的Python数据操纵、数据分析库,提供标注过的数据结构类似于 R 语言的data.frame 对象、统计函数等等
#计算机科学# streamlit 是一个通过Python脚本生成可视化交互式Web页面的工具,适合数据分析师
#计算机科学# Gradio是一个开源的Python库,用于构建演示机器学习或数据科学,以及web应用程序。使用Gradio,您可以基于您的机器学习模型或数据科学工作流快速创建一个漂亮的用户界面,让用户可以”尝试“拖放他们自己的图像、粘贴文本、录制他们自己的声音,并通过浏览器与您的演示程序进行交互。
#计算机科学# Pretrain, finetune ANY AI model of ANY size on multiple GPUs, TPUs with zero code changes.
翻译 - 轻巧的ML研究人员专用的PyTorch包装器。缩放模型。写更少样板
#计算机科学# Python 数据科学学习笔记:深度学习 (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, 大数据 (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python 核心, AWS, Linux命令
aka "Bayesian Methods for Hackers": An introduction to Bayesian methods + probabilistic programming with a computation/understanding-first, mathematics-second point of view. All in pure Python ;)
翻译 - 又名“黑客的贝叶斯方法”:贝叶斯方法+概率编程的介绍,具有计算/理解第一,数学第二的观点。全部使用纯Python;)
#计算机科学# Machine Learning From Scratch. Bare bones NumPy implementations of machine learning models and algorithms with a focus on accessibility. Aims to cover everything from linear regression to deep learnin...
翻译 - 从零开始的机器学习。机器学习模型和算法的裸露NumPy实现重点在于可访问性。旨在涵盖从线性回归到深度学习的所有内容。
#自然语言处理# Interactive deep learning book with multi-framework code, math, and discussions. Adopted at 500 universities from 70 countries including Stanford, MIT, Harvard, and Cambridge.
翻译 - 包含代码,数学和讨论的交互式深度学习书。在多框架中可用。
#计算机科学# Fastai book,以Jupyter Notebook形式发布。fastai是一个用于深度学习的分层API,这些notebook包含了对深度学习,fastai,以及PyTorch的介绍
一个使用Python构建机器学习、数据分析web app的框架,无需 JavaScript