diff --git a/README.md b/README.md index 0a04c08214b688ce44724ec344bdd9464b68a3dd..394462685a8d0255b67f19efd55181586e1b7142 100644 --- a/README.md +++ b/README.md @@ -33,6 +33,23 @@ Aprés mettre identifié grace à la commande : `huggingface-cli login` ## Weights & Biases **(TODO: trouver comment mettre des données utiles)** +``` +import wandb +import gym +from stable_baselines3 import A2C + +wandb.init(project='a2c_CartPole') +env = gym.make('CartPole-v1') +model = A2C("MlpPolicy", env, verbose=1) +model.learn(total_timesteps=500000) +observations = [env.reset() for _ in range(100)] +actions, _states = model.predict(observations) +accuracy = sum([a == env.action_space.label[i] for i, a in enumerate(actions)]) / len(actions) +wandb.log({"model": model, 'accuracy':accuracy}) +model.save("a2c_CartPole") +``` + + ## panda-gym **(TODO: réussir à import et verifier le code puis le telecharger sur Hugging Face Hub)**