offline-reinforcement-learning

High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC

d4rl gym offline-reinforcement-learning reinforcement-learning

Python 1.18 k

2 年前

ikostrikov / jaxrl

#计算机科学#JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

深度学习 deep-reinforcement-learning continuous-control reinforcement-learning soft-actor-critic sac deep-deterministic-policy-gradient jax flax gym offline-reinforcement-learning

Jupyter Notebook 673

2 年前

yihaosun1124 / OfflineRL-Kit

#计算机科学#An elegant PyTorch offline reinforcement learning library for researchers.

深度学习 deep-reinforcement-learning PyTorch reinforcement-learning offline-reinforcement-learning

Python 316

1 年前

Allenpandas / Reinforcement-Learning-Papers

📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

deep-reinforcement-learning reinforcement-learning dqn imitation-learning multi-agent-reinforcement-learning policy-gradient q-learning 人工智能 aaai icml neurips offline-reinforcement-learning

309

10 个月前

Cryolite / kanachan

#计算机科学#A Japanese (Riichi) Mahjong AI Framework

mahjong riichi-mahjong majsoul 机器学习 game-ai reinforcement-learning 深度学习 deep-reinforcement-learning transformers transformer imitation-learning offline-reinforcement-learning dqn

Python 306

2 个月前

nikhilbarhate99 / min-decision-transformer

#计算机科学#Minimal implementation of Decision Transformer: Reinforcement Learning via Sequence Modeling in PyTorch for mujoco control tasks in OpenAI gym

reinforcement-learning deep-reinforcement-learning 深度学习 offline-reinforcement-learning PyTorch pytorch-transformers transformer 机器学习 openai-gym mujoco Robotics

Python 267

3 年前

polixir / OfflineRL

A collection of offline reinforcement learning algorithms.

offline-reinforcement-learning reinforcement-learning

Python 176

5 个月前

instadeepai / og-marl

Datasets with baselines for offline multi-agent reinforcement learning.

multi-agent-reinforcement-learning reinforcement-learning offline-reinforcement-learning

Python 162

5 天前

nissymori / JAX-CORL

Clean single-file implementation of offline RL algorithms in JAX

jax single-file flax cql reinforcement-learning d4rl offline-reinforcement-learning

Python 140

4 个月前

BY571 / CQL

#计算机科学#PyTorch implementation of the Offline Reinforcement Learning algorithm CQL. Includes the versions DQN-CQL and SAC-CQL for discrete and continuous action spaces.

reinforcement-learning-algorithms offline-reinforcement-learning dqn sac pytorch-implementation PyTorch 机器学习

Python 135

1 年前

polixir / NeoRL

Python interface for accessing the near real-world offline reinforcement learning (NeoRL) benchmark datasets

offline-reinforcement-learning

Python 117

5 个月前

ZhengyaoJiang / latentplan

Code release for Efficient Planning in a Compact Latent Action Space (ICLR2023) https://arxiv.org/abs/2208.10291.

model-based-reinforcement-learning offline-reinforcement-learning reinforcement-learning generative-model transformer

Python 105

2 年前

ZhengYinan-AIR / FISOR

[ICLR 2024] The official implementation of "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"

diffusion-models jax offline-reinforcement-learning imitation-learning reinforcement-learning

Python 94

2 个月前

snu-mllab / EDAC

Official PyTorch implementation of "Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble" (NeurIPS'21)

offline-reinforcement-learning

Python 75

3 年前

DHDev0 / Stochastic-muzero

#计算机科学#Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variation...

机器学习 offline-reinforcement-learning deep-reinforcement-learning gym-environments lstm monte-carlo-tree-search muzero PyTorch rl transformer multilayer-perceptron

Python 64

1 年前