continuous-control · GitHub Topics

#计算机科学#PyTorch implementation of Advantage Actor Critic (A2C), Proximal Policy Optimization (PPO), Scalable trust-region method for deep reinforcement learning using Kronecker-factored approximation (ACKTR) ...

PyTorch reinforcement-learning 深度学习 deep-reinforcement-learning actor-critic advantage-actor-critic a2c ppo proximal-policy-optimization hessian atari mujoco roboschool continuous-control ale

Python 3.73 k

3 年前

opendilab / LightZero

[NeurIPS 2023 Spotlight] LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios (awesome MCTS)

alphazero atari continuous-control monte-carlo-tree-search muzero PyTorch reinforcement-learning mcts board-game gym self-play

Python 1.33 k

1 天前

rl-tools / rl-tools

#计算机科学#The Fastest Deep Reinforcement Learning Library

continuous-control C++深度学习 mujoco reinforcement-learning Robotics tinyml tinyrl

C++ 779

11 天前

ikostrikov / jaxrl

#计算机科学#JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

深度学习 deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym offline-reinforcement-learning

Jupyter Notebook 673

2 年前

denisyarats / pytorch_sac

#计算机科学#PyTorch implementation of Soft Actor-Critic (SAC)

reinforcement-learning dm-control soft-actor-critic PyTorch deep-reinforcement-learning actor-critic mujoco gym 深度学习 sac continuous-control

Jupyter Notebook 538

3 年前

Omegastick / pytorch-cpp-rl

PyTorch C++ Reinforcement Learning

翻译 - PyTorch C ++强化学习

PyTorch C++reinforcement-learning reinforcement-learning-algorithms a2c ppo pytorch-rl pytorch-cpp-frontend libtorch actor-critic advantage-actor-critic proximal-policy-optimization continuous-control

C++ 521

5 年前

ikostrikov / pytorch-trpo

#计算机科学#PyTorch implementation of Trust Region Policy Optimization

reinforcement-learning continuous-control 深度学习 mujoco PyTorch deep-reinforcement-learning

Python 441

7 年前

chingyaoc / pytorch-REINFORCE

PyTorch Implementation of REINFORCE for both discrete & continuous control

reinforcement-learning reinforce continuous-control mujoco PyTorch gym

Python 265

8 年前

openai / EPG

#计算机科学#Code for the paper "Evolved Policy Gradients"

机器学习 reinforcement-learning continuous-control meta-learning Bukkit

Python 250

6 年前

m5823779 / motion-planner-reinforcement-learning

#计算机科学#End to end motion planner using Deep Deterministic Policy Gradient (DDPG) in gazebo

deep-reinforcement-learning 神经网络深度学习 deep-deterministic-policy-gradient ddpg Tensorflow continuous-control navigation gazebo

Python 231

2 年前

andrewliao11 / gail-tf

Tensorflow implementation of generative adversarial imitation learning

imitation-learning Tensorflow continuous-control Generative Adversarial Network inverse-reinforcement-learning reinforcement-learning

Python 200

7 年前

zhihanyang2022 / off-policy-continuous-control

Official PyTorch code for "Recurrent Off-policy Baselines for Memory-based Continuous Control" (DeepRL Workshop, NeurIPS 21)

PyTorch recurrent-neural-network actor-critic continuous-control reinforcement-learning

Python 83

1 年前

andrewliao11 / pytorch-a3c-mujoco

Implement A3C for Mujoco gym envs

PyTorch reinforcement-learning a3c mujoco continuous-control actor-critic

Python 72

7 年前

fshamshirdar / pytorch-rdpg

PyTorch Implementation of the RDPG (Recurrent Deterministic Policy Gradient)

PyTorch recurrent-neural-networks deep-reinforcement-learning continuous-control

Python 55

2 年前

Scitator / catalyst-rl-framework

#计算机科学#Catalyst.RL: A Distributed Framework for Reproducible RL Research

深度学习 reinforcement-learning continuous-control mujoco PyTorch Python benchmark 框架

Python 39

6 年前

simionsoft / SimionZoo

A workbench for online model-free Reinforcement Learning on continuous control problems

翻译 - 在线模型的连续控制问题的免费在线强化学习工作台

reinforcement-learning cntk continuous-control distributed-systems Windows Linux

C++ 37

2 年前

BY571 / Normalized-Advantage-Function-NAF-

PyTorch implementation of the Q-Learning Algorithm Normalized Advantage Function for continuous control problems + PER and N-step Method

reinforcement-learning reinforcement-learning-algorithms q-learning continuous-control dqn

Jupyter Notebook 30

4 年前

LQNew / Continuous_Control_Benchmark

Benchmark data (i.e., DeepMind Control Suite and MuJoCo) for RL.

mujoco continuous-control reinforcement-learning td3 ddpg sac ppo

Python 28

4 年前

alirezakazemipour / Continuous-PPO

Proximal Policy Optimization (Continuous Version) in PyTorch.

ppo continuous-control

Python 27

3 年前

mknbv / neuralode-rl

Neural Ordinary Differential Equations for Reinforcement Learning

reinforcement-learning Tensorflow continuous-control mujoco roboschool

Python 22

2 年前