Skip to content
Snippets Groups Projects
Commit 7fa09d8f authored by cgerest's avatar cgerest
Browse files

Update readme

parent 7ee58fc2
No related branches found
No related tags found
No related merge requests found
...@@ -38,7 +38,7 @@ Pour exécuter chaque fichier, vous pouver utiliser un terminal. avec la command ...@@ -38,7 +38,7 @@ Pour exécuter chaque fichier, vous pouver utiliser un terminal. avec la command
Dans le 1er fichier: reinforce_cartpole.py, on implémente la méthode REINFORCE sur l'environnement CartPole-v1 et on visualise l'évolution du reward au cours des itérations (cf rewards_cartpole.png). Dans le 1er fichier: reinforce_cartpole.py, on implémente la méthode REINFORCE sur l'environnement CartPole-v1 et on visualise l'évolution du reward au cours des itérations (cf rewards_cartpole.png).
![Image](Reinforce_cartpole_rewards2.png) ![Image](rewards_cartpole.png)
Dans le 2ème fichier: a2c_sb3_cartpole.py, on se familiarise avec le package Stable-Baselines3 qui fournit des outils intégrés, et on l'utilise pour résoudre l'environnement CartPole avec l'algo A2C (Advantage Actor-Critic). Dans le 2ème fichier: a2c_sb3_cartpole.py, on se familiarise avec le package Stable-Baselines3 qui fournit des outils intégrés, et on l'utilise pour résoudre l'environnement CartPole avec l'algo A2C (Advantage Actor-Critic).
En plus d'avoir accès à l'évolution du reward au cours des itérations, ce script sauvegarde un modèle sous le nom [insérer nom final]. En plus d'avoir accès à l'évolution du reward au cours des itérations, ce script sauvegarde un modèle sous le nom [insérer nom final].
......
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment