Data science is an inter-disciplinary field that uses scientific methods, processes, algorithms, and systems to extract knowledge from structured and unstructured data. Data scientists perform data analysis and preparation, and their findings inform high-level decisions in many organizations.
Apache Superset 是一个企业级数据可视化和数据分析的平台。
#计算机科学#Keras是一个基于 Python 的深度学习库,能够在TensorFlow、Microsoft Cognitive Toolkit、Theano或PlaidML之上运行。
#计算机科学#Apache Airflow 是一个workflow工作流调度、编排、监控平台
#计算机科学#streamlit 是一个通过Python脚本生成可视化交互式Web页面的工具,适合数据分析师
#大语言模型#Ray is an AI compute engine. Ray consists of a core distributed runtime and a set of AI Libraries for accelerating ML workloads.
翻译 - 一个快速简单的框架,用于构建和运行分布式应用程序。 Ray与RLlib(可扩展的强化学习库)和Tune(可扩展的超参数调整库)打包在一起。
#自然语言处理#工业级的 Python/CPython 自然语言处理(NLP)库
#学习与技能提升#2022 人工智能专家学习路线图
#计算机科学#Python 数据科学学习笔记:深度学习 (TensorFlow, Theano, Caffe, Keras), scikit-learn, Kaggle, 大数据 (Spark, Hadoop MapReduce, HDFS), matplotlib, pandas, NumPy, SciPy, Python 核心, AWS, Linux命令
#自然语言处理#精选大公司分享他们在生产中关于数据科学 & 机器学习的论文和技术博客等资源
aka "Bayesian Methods for Hackers": An introduction to Bayesian methods + probabilistic programming with a computation/understanding-first, mathematics-second point of view. All in pure Python ;)
翻译 - 又名“黑客的贝叶斯方法”:贝叶斯方法+概率编程的介绍,具有计算/理解第一,数学第二的观点。全部使用纯Python;)
#自然语言处理#Interactive deep learning book with multi-framework code, math, and discussions. Adopted at 500 universities from 70 countries including Stanford, MIT, Harvard, and Cambridge.
翻译 - 包含代码,数学和讨论的交互式深度学习书。在多框架中可用。
#计算机科学#Machine Learning From Scratch. Bare bones NumPy implementations of machine learning models and algorithms with a focus on accessibility. Aims to cover everything from linear regression to deep learnin...
翻译 - 从零开始的机器学习。机器学习模型和算法的裸露NumPy实现重点在于可访问性。旨在涵盖从线性回归到深度学习的所有内容。