From 590dd075d798500b4dd68a2e9191223c99b8fa58 Mon Sep 17 00:00:00 2001 From: Ghelfi Manon <manon.ghelfi@ecl19.ec-lyon.fr> Date: Wed, 8 Feb 2023 14:35:45 +0000 Subject: [PATCH] Update README.md --- README.md | 18 ++++++++++-------- 1 file changed, 10 insertions(+), 8 deletions(-) diff --git a/README.md b/README.md index d5b8193..6751389 100644 --- a/README.md +++ b/README.md @@ -2,19 +2,22 @@ ## Reinforce -Le fichier reinforce_cartpole.py est composer d'un agent (Neural Network) et le l'entrainement d'un model pour le problème du CartPole. +The file reinforce_cartpole.py is composed of an agent (Neural Network) and the training of a model for the CartPole problem. -Le graphique de l'évolution des recompenses totales aux cours des épisodes est présent dans le fichier : image.png + +The graph of the evolution of the total rewards during the episodes is present in the file : image.png ## Stable-Baselines3 -Le fichier a2c_sb3_cartpole.py comporte un model pour resoudre le problème du CartPole en utilisant un algorithme Advantage Actor-Critic (A2C) grace à la bilbiothèque Stable-Baselines3. +The file a2c_sb3_cartpole.py contains a model to solve the CartPole problem using an Advantage Actor-Critic (A2C) algorithm with the Stable-Baselines3 library. ## Hugging Face Hub + +I uploaded my model on huggingface : https://huggingface.co/manonghelfi/a2c_cartpole/tree/main -J'ai téléchargé mon model sur huggingface avec les commandes python suivantes : +With the following python commands: ``` from huggingface_sb3 import push_to_hub @@ -26,13 +29,12 @@ push_to_hub( ) ``` - -Aprés mettre identifié grace à la commande : `huggingface-cli login` +After identifying with the command : `huggingface-cli login` ## Weights & Biases -Le run du model est présent ici : https://wandb.ai/ghelfi/cartpole-training/runs/06exlpbm +The run of the model is here : https://wandb.ai/ghelfi/cartpole-training/runs/06exlpbm -Réalisé grace au code ci dessous : +Realized with the code below: ``` import wandb wandb.init(project='cartpole-training') -- GitLab