Skip to content
Snippets Groups Projects
Commit 024b0bdc authored by Gilares Paul's avatar Gilares Paul
Browse files

Edit README.md

parent 4d9cb545
No related branches found
No related tags found
No related merge requests found
# 0. Sommaire des directory
* `backend` : code du backend et la data finale (fichiers csv `score_sigmoid`).
* `data` : directory vide, nous servait à accueillir les fichiers intermédiaires pendant le traitement, pour la plupart inscrits dans le gitignore car très volumineux.
* `frontend` : code du frontend.
* `slides présentation projet` : slides de présentation.
* `src` : code de traitement des données, calcul des scores, tests et explorations.
# 1. But du projet
Ce projet vise à **analyser la qualité de l'eau courante en France et son évolution entre 2018 et 2024**, en se basant sur divers indicateurs tels que le pH, le chlore, les nitrites, les nitrates, les métaux lourds et les pesticides.
......@@ -18,13 +27,14 @@ Pour chaque année, nous avons récupéré un fichier Zip sur [**data.gouv.fr**]
Il nous manquait alors une **table des correspondances** entre les paramètres et leurs codes d'identification (seule information disponible dans les fichiers de data.gouv), que nous avons trouvé sur le site de la [Sandre](https://www.sandre.eaufrance.fr/v2/) (Service d'administration nationale des données et référentiels sur l'eau), afin d'interpréter les codes présents dans les fichers.
Nous nous sommes aussi aperçu que les coordonnées des lieux étant encodées en **Lambert 93** et non en GPS, que certaines lignes n'avaient pas de coordonnées et même que d'autres avaient leurs coordonnées inversées.
Nous nous sommes aussi aperçu que les coordonnées des lieux étant encodées en **Lambert 93** et non en GPS, que certaines lignes n'avaient pas de coordonnées et même que d'autres avaient leurs coordonnées inversées.\
Pour les lignes sans coordonnées, nous nous sommes servis d'une base de données des communes françaises trouvée sur [data.gouv.fr](https://www.data.gouv.fr/fr/datasets/communes-de-france-base-des-codes-postaux/) pour compléter la data en ajoutant pour ces lignes les coordonnées GPS de la commune correspondante (à défaut de celles du point de prélèvement).
## Preprocessing et choix des indicateurs
Pour chaque année, les fichiers de données **UDI_RES** et **UDI_PLV** ont donc été chargés et nettoyés, avec normalisation des formats et conversion des valeurs numériques et des coordonnées.
Une jointure a été effectuée sur ces fichiers en utilisant la référence commune `referenceprel`. Les lignes ont été filtrées selon les paramètres/indicateurs qui nous intéressaient. Les coordonnées GPS inversées ont été corrigées et les valeurs manquantes complétées en fusionnant avec les coordonnées des communes. Enfin, les doublons ont été supprimés du fichier final.
Une jointure a été effectuée sur ces fichiers en utilisant la référence commune `referenceprel`. Les doublons ont été suppriméses puis les lignes ont été filtrées selon les paramètres/indicateurs qui nous intéressaient. Enfin, les coordonnées GPS inversées ont été corrigées et les valeurs manquantes complétées en fusionnant avec les coordonnées des communes.
Grâce à une analyse de la littérature mais également de la densité nos données, nous avons choisi de concentrer notre étude sur les paramètres/indicateurs suivants :
......@@ -105,7 +115,7 @@ Ensuite, afin de calculer un **score global** de qualité de l'eau, nous avons p
1. **Pesticides** : Pondération élevée (**2.5**).
1. **Nitrites & Nitrates** : Pondération élevée (**2.0**), en tenant compte de la toxicité plus élevée des nitrites.
1. **pH** : Pondération modérée (**1.5**).
1. **Chlore** : Pondération modérée (**1.0**).
1. **Chlore** : Pondération faible (**1.0**).
......@@ -113,6 +123,10 @@ Ensuite, afin de calculer un **score global** de qualité de l'eau, nous avons p
Enfin, le **score global** est calculé comme la moyenne pondérée des scores de chaque catégories. Cette approche permet à nouveau de prendre en compte l'importance relative de chaque indicateur tout en fournissant une évaluation globale de la qualité de l'eau.
## Tables finales
Les tables finales sont les fichiers csv `score_sigmoid`, disponibles dans le directory `backend > data`.
# 5. Analyser les scores
......@@ -165,7 +179,7 @@ Pour lancer le front, rentrez les commandes suivantes dans le dossier frontend :
Vous arriverez alors sur notre **application**, vous n'aurez plus qu'à choisir les paramètres que vous souhaitez analyser et observer les résultats à l'échelle du pays et à l'échelle départementale, ainsi que leurs évolutions.
Comme évoqué dans la partie **3. Prétraitement de la data**, nous avons pris soin de préparé la data pour pouvoir mener des analyses plus poussées, que nous n'avons pas eu le temps d'implémenter dans le temps imparti de ce projet. Les prochaines étapes consisteront alors en l'étude la qualité de l'eau à l'échelle communale voire même directement à celle du point de surveillance et sa zone d'influence, le tout mensuellement et plus simplement annuellement. Un système de recherche à la maille de la commune est également envisagé, avec plus tard des systèmes d'alerte en fonction des résultats des prélèvements.
Comme évoqué dans la partie **3. Prétraitement de la data**, nous avons pris soin de préparé la data pour pouvoir mener des analyses plus poussées, que nous n'avons pas eu le temps d'implémenter dans le temps imparti de ce projet. Les prochaines étapes consisteraient alors en l'étude la qualité de l'eau à l'échelle communale voire même directement à celle du point de surveillance et sa zone d'influence, le tout mensuellement et plus simplement annuellement, avec par exemple des informations supplémentaires sur les 3 derniers prélèvements en date de la commune. Une barre de recherche à la maille de la commune pourrait également être envisageable, avec plus tard des systèmes d'alerte en fonction des résultats des prélèvements.
## Démonstration d'utilisation de l'application
......@@ -173,4 +187,5 @@ Voici une vidéo démonstration réalisée en local :
[🎥 Regarder la vidéo sur YouTube](https://www.youtube.com/watch?v=WMNTjgHbWVc)
# 7. Présentation
Les slides de la présentation de notre projet sont disponible dans le directory `slides présentation projet`.
0% Loading or .
You are about to add 0 people to the discussion. Proceed with caution.
Please register or to comment