Le fichier reinforce_cartpole.py est composer d'un agent (Neural Network) et le l'entrainement d'un model pour le problème du CartPole.
The file reinforce_cartpole.py is composed of an agent (Neural Network) and the training of a model for the CartPole problem.
Le graphique de l'évolution des recompenses totales aux cours des épisodes est présent dans le fichier : image.png
The graph of the evolution of the total rewards during the episodes is present in the file : image.png
## Stable-Baselines3
Le fichier a2c_sb3_cartpole.py comporte un model pour resoudre le problème du CartPole en utilisant un algorithme Advantage Actor-Critic (A2C) grace à la bilbiothèque Stable-Baselines3.
The file a2c_sb3_cartpole.py contains a model to solve the CartPole problem using an Advantage Actor-Critic (A2C) algorithm with the Stable-Baselines3 library.