强化学习中文教程(蘑菇书🍄),在线阅读地址:https://datawhalechina.github.io/easy-rl/
An elegant PyTorch deep reinforcement learning library.
翻译 - 优雅,灵活和超快的PyTorch深度强化学习平台。
PyTorch implementation of DQN, AC, ACER, A2C, A3C, PG, DDPG, TRPO, PPO, SAC, TD3 and ....
翻译 - DQN、AC、ACER、A2C、A3C、PG、DDPG、TRPO、PPO、SAC、TD3 和...的 PyTorch 实现。
Massively Parallel Deep Reinforcement Learning. 🔥
翻译 - 使用Pytorch的深度加强学习算法轻量级,高效稳定的实现。
#计算机科学# Proximal Policy Optimization (PPO) algorithm for Super Mario Bros
翻译 - 超级马里奥兄弟的近距离策略优化(PPO)算法