Skip to content
Snippets Groups Projects
Commit 590dd075 authored by Ghelfi Manon's avatar Ghelfi Manon
Browse files

Update README.md

parent d1fd9406
No related branches found
No related tags found
No related merge requests found
......@@ -2,19 +2,22 @@
## Reinforce
Le fichier reinforce_cartpole.py est composer d'un agent (Neural Network) et le l'entrainement d'un model pour le problème du CartPole.
The file reinforce_cartpole.py is composed of an agent (Neural Network) and the training of a model for the CartPole problem.
Le graphique de l'évolution des recompenses totales aux cours des épisodes est présent dans le fichier : image.png
The graph of the evolution of the total rewards during the episodes is present in the file : image.png
## Stable-Baselines3
Le fichier a2c_sb3_cartpole.py comporte un model pour resoudre le problème du CartPole en utilisant un algorithme Advantage Actor-Critic (A2C) grace à la bilbiothèque Stable-Baselines3.
The file a2c_sb3_cartpole.py contains a model to solve the CartPole problem using an Advantage Actor-Critic (A2C) algorithm with the Stable-Baselines3 library.
## Hugging Face Hub
I uploaded my model on huggingface :
https://huggingface.co/manonghelfi/a2c_cartpole/tree/main
J'ai téléchargé mon model sur huggingface avec les commandes python suivantes :
With the following python commands:
```
from huggingface_sb3 import push_to_hub
......@@ -26,13 +29,12 @@ push_to_hub(
)
```
Aprés mettre identifié grace à la commande : `huggingface-cli login`
After identifying with the command : `huggingface-cli login`
## Weights & Biases
Le run du model est présent ici : https://wandb.ai/ghelfi/cartpole-training/runs/06exlpbm
The run of the model is here : https://wandb.ai/ghelfi/cartpole-training/runs/06exlpbm
Réalisé grace au code ci dessous :
Realized with the code below:
```
import wandb
wandb.init(project='cartpole-training')
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment