#

muzero

Here are 40 public repositories matching this topic...

opendilab / LightZero

[NeurIPS 2023 Spotlight] LightZero: A Unified Benchmark for Monte Carlo Tree Search in General Sequential Decision Scenarios

Updated Jun 5, 2024
Python

souvikshanku / tic-tac-toe-zero

MuZero - tic-tac-toe

tic-tac-toe muzero

Updated Jun 2, 2024
Python

rlglab / minizero

MiniZero: An AlphaZero and MuZero Training Framework

go hex reinforcement-learning deep-reinforcement-learning mcts othello gomoku tictactoe atari monte-carlo-tree-search nogo board-games alphazero muzero gumbel-alphazero gumbel-muzero outer-open-gomoku killall-go

Updated May 27, 2024
C++

yenw / computer-go-dataset

datasets for computer go

go sgf alphago computer-go tygem computer-go-dataset fineart alphazero minigo phoenixgo leelazero muzero golaxy elf-opengo

Updated May 22, 2024
C++

CogitoNTNU / MuZero

An implementation of the MuZero algorithm by Google Deepmind. Research paper here: https://arxiv.org/abs/1911.08265

Updated May 8, 2024
Python

tuero / muzero-cpp

A C++ pytorch implementation of MuZero

machine-learning reinforcement-learning cpp pytorch mcts alphazero libtorch muzero

Updated May 1, 2024
C++

benborder / drla-sim

Trains a deep reinforcement learning agent in simulation testbed environments with the DRLA library.

reinforcement-learning cpp deep-reinforcement-learning pytorch cartpole connect4 ppo dreamer libtorch muzero

Updated Apr 27, 2024
C++

benborder / drla-atari

Trains deep reinforcement learning agents in Atari environments via the DRLA library.

reinforcement-learning cpp deep-reinforcement-learning pytorch atari ppo dreamer libtorch muzero

Updated Apr 27, 2024
C++

benborder / drla

C++ Deep Reinforcement Learning Agent library

reinforcement-learning cpp deep-reinforcement-learning pytorch ppo dreamer libtorch muzero

Updated Apr 27, 2024
C++

AntoniovanDijck / BlackJackRL

Deep Q Learning blackbox strategies for casino games

machine-learning deep-neural-networks reinforcement-learning deep-learning tensorflow blackjack deep-reinforcement-learning torch reinforcement-learning-algorithms deep-q-network mlx rlx q-learning-algorithm muzero

Updated Mar 22, 2024
Jupyter Notebook

Itomigna2 / Muesli-lunarlander

Muesli RL algorithm implementation (PyTorch) (LunarLander-v2)

reinforcement-learning deep-learning colab muesli model-based-rl lunarlander-v2 muzero

Updated Mar 18, 2024
Jupyter Notebook

jianzhnie / RLZero

A clean and easy implementation of MuZero, AlphaZero and Self-Play reinforcement learning algorithms for any game.

reinforcement-learning multi-agent mcts alpha-zero self-play muzero

Updated Mar 11, 2024
Python

abrahamabel / Muzero-GDM_Pseudo_Code

A Notebook implementation of the Pseudocode from the original Muzero paper

python jupyter-notebook mcts muzero muzero-pseudocode

Updated Jan 14, 2024
Jupyter Notebook

werner-duvaud / muzero-general

MuZero

machine-learning reinforcement-learning deep-learning neural-network deep-reinforcement-learning python3 pytorch gym mcts rl tensorboard residual-network monte-carlo-tree-search self-learning alphago model-based-rl alphazero muzero muzero-general

Updated Jan 7, 2024
Python

ChukwumaChukwuma / enyimba_ai

Applying AlphaZero Self-Play Tactics to LLaMA for Enhanced Chatbot Interaction

machine-learning natural-language-processing reinforcement-learning ai chatbot artificial-intelligence strategy policy-evaluation alphazero muzero prompt-engineering llms generative-ai rlhf llama2

Updated Jan 5, 2024
Python

rystrauss / dopamax

Reinforcement learning in pure JAX.

reinforcement-learning dqn mcts ppo podracer alphazero jax muzero brax anakin dopamax

Updated Dec 30, 2023
Python

GenesisZero

abrahamabel / GenesisZero

GenesisZERO : potential applications for MCTS agents with LLMs for Sequential decision-making

reinforcement-learning deep-reinforcement-learning gym reinforcement-learning-algorithms monte-carlo-tree-search gym-environment reinforcement-learning-agent alphazero mcts-algorithm muzero large-language-models llm llms stochastic-muzero muzero-stochastic llm-agent

Updated Dec 16, 2023

michaelnny / muzero

A PyTorch implementation of DeepMind's MuZero agent

reinforcement-learning pytorch model-based-rl alphazero muzero

Updated Dec 1, 2023
Python

chappie.ai

bellerb / chappie.ai

Generalized AI to perform a multitude of tasks written in python3

ai ml python3 pytorch transformer mcts attention-mechanism chess-ai muzero perceiver perceiverio

Updated Oct 24, 2023
Jupyter Notebook

DHDev0 / Stochastic-muzero

Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variations.

machine-learning deep-reinforcement-learning pytorch transformer lstm rl monte-carlo-tree-search multilayer-perceptron gym-environments muzero arxiv-papers offline-reinforcement-learning resnetv2 online-reinforcement-learning stochastic-muzero muzero-stochastic

Updated Oct 20, 2023
Python

Improve this page

Add a description, image, and links to the muzero topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the muzero topic, visit your repo's landing page and select "manage topics."