Skip to content
Snippets Groups Projects
Select Git revision
  • main default protected
  • epaganel-main-patch-63e8
2 results

mso_3_4-td1

  • Clone with SSH
  • Clone with HTTPS
  • Forked from Dellandrea Emmanuel / MSO_3_4-TD1
    8 commits behind, 4 commits ahead of the upstream repository.

    Hands-On Reinforcement Learning

    Introduction

    Dans ce projet pratique, nous allons d'abord implémenter un algorithme simple de RL et l'appliquer pour résoudre l'environnement CartPole-v1. Une fois que nous aurons pris connaissance du flux de travail de base, nous apprendrons à utiliser divers outils pour l'entraînement, la surveillance et le partage de modèles d'apprentissage automatique, en appliquant ces outils pour entraîner un bras robotique.

    Structure du Repository

    Ce repository contient les fichiers suivants :

    • reinforce_cartpole.py: Implémentation de l'algorithme REINFORCE pour résoudre l'environnement CartPole-v1.
    • a2c_sb3_cartpole.py: Utilisation de l'algorithme Advantage Actor-Critic (A2C) pour résoudre l'environnement CartPole-v1 avec Stable-Baselines3.
    • a2c_sb3_panda_reach.py: Entraînement d'un modèle A2C sur l'environnement PandaReachJointsDense-v2 avec Stable-Baselines3.
    • README.md: Ce fichier, fournissant des instructions sur le projet et les fichiers inclus.

    Prérequis

    Avant de commencer, assurez-vous d'avoir installé les bibliothèques nécessaires. Vous pouvez les installer en utilisant pip :

    pip install stable-baselines3
    pip install huggingface-sb3==2.3.1
    pip install panda-gym==3.0.7
    pip install wandb tensorboard

    Instructions

    1. CartPole Environment avec REINFORCE:

      • Exécutez le script reinforce_cartpole.py pour entraîner et résoudre l'environnement CartPole-v1 avec l'algorithme REINFORCE.
      • Visualisez les performances de l'agent en utilisant les graphiques affichés par l'algorithme.
    2. CartPole Environment avec A2C:

    3. PandaReachJointsDense-v2 Environment avec A2C:

    Author

    Emilien PAGENLLI

    License

    MIT