From 2e15fdbf79369ba9971a5fd643896cfae87a3c91 Mon Sep 17 00:00:00 2001 From: cgerest <148561679+corentingst@users.noreply.github.com> Date: Tue, 5 Mar 2024 19:39:58 +0100 Subject: [PATCH] Update ReadMe --- README.md | 2 +- 1 file changed, 1 insertion(+), 1 deletion(-) diff --git a/README.md b/README.md index 01aa9fe..dfd6e5a 100644 --- a/README.md +++ b/README.md @@ -45,7 +45,7 @@ En plus d'avoir accès à l'évolution du reward au cours des itérations, ce sc Afin d'upload ce modèle sur Hugging Face, j'ai utilisé le court script 'push_model_HF.py'. Le modèle entrainé est retrouvable ici: https://huggingface.co/CorentinGst/Cartpolev1/tree/main/a2c_cartpole_model. -Dans le 3ème fichier 'train_wb.py', je track l'entraînement sur l'environnement CartPole via Weights and Biases (W&B). Le résultat est visible ici: https://wandb.ai/corentin-ge/wandb_test_cartpole/runs/ybbl1bih?workspace=user-corentin-ge +Dans le 3ème fichier 'train_wb.py', on track l'entraînement sur l'environnement CartPole via Weights and Biases (W&B). Le résultat est visible ici: https://wandb.ai/corentin-ge/wandb_test_cartpole/runs/ybbl1bih?workspace=user-corentin-ge Finalement, en mettant bout à bout ces différentes étapes, on peut constituer un flux de travail complet sur un nouvel environnement: PandaReachJointsDense. -- GitLab