@@ -27,16 +27,16 @@ Lors de la phase de réflexion et de choix du sujet, nous sommes tombés sur plu
* Une **carte intéractive qualité de l'eau proposée** par [**UFC que choisir**](https://www.quechoisir.org/carte-interactive-qualite-eau-n21241/#), qui permet de voir la qualité de l'eau selon plusieurs critères pour une **ville sélectionnée** via une barre de recherche le tout à l'échelle des **points de surveillance**. \
Cependant cette visualisation ne permet l'étude qu'à l'échelle communale, ne permet pas la comparaison directe entre 2 zones (ex : villes, départements, régions) en France hormis à l'échelle d'une même ville entre ses différents points de surveillance et n'indique pas l'évolution de la qualité de l'eau.
* Plusieurs **cartes** proposées par [**Lyzo**](https://lyzo.fr/Carte/), en particulier [**celle ci**](https://app.ou-vivre.fr/map/?x=177265&y=5867207&z=6.24591730563298&l=admin%2Cpollu_lyzo_tx_nc&lb=positron&config=apps/explore.fr.xml&mode=d#), qui propose une étude de la **qualité de l'eau à l'échelle communale** (uniquement). \
* Plusieurs **cartes** proposées par [**Lyzo**](https://lyzo.fr/Carte/), en particulier [**celle ci**](https://app.ou-vivre.fr/map/?x=177265&y=5867207&z=6.24591730563298&l=admin%2Cpollu_lyzo_tx_nc&lb=positron&config=apps/explore.fr.xml&mode=d#) qui propose une étude de la **qualité de l'eau à l'échelle communale** (uniquement). \
Cette visualisation n'indique pas non plus l'évolution de la qualité de l'eau.
Ces 2 visualisations proposent donc une étude de la qualité de l'eau à l'échelle communale se basant sur le taux de prélèvements non conformes (et/ou le taux de prélèvements conformes pour certains paramètres) et donc **ne proposent pas de score** à proprement parlé. Elles **ne proposent pas non plus d'étude de l'évolution** de cette qualité.
Nous allons donc dans ce projet nous pencher particulièrement sur l'**élaboration d'un modèle de calcul de scores**, plus parlant dans un but de sensibilisation des populations, tout en permettant une **analyse départementale, comparative temporellement et géographiquement**, et avec la possibilité de se concentrer sur certains paramètres, pour une analyse et une comparaison plus approfondies.
Nous allons donc dans ce projet nous pencher particulièrement sur l'**élaboration d'un modèle de calcul de scores**, plus parlant dans un but de **sensibilisation des populations**, tout en permettant une **analyse départementale, comparative temporellement et géographiquement**, et avec la possibilité de se concentrer sur certains paramètres, pour une analyse et une comparaison plus approfondies.
# 2. D’où vient la data ?
Les données principales utilisées pour ce projet proviennent du site [**data.gouv.fr**](https://www.data.gouv.fr/fr/datasets/resultats-du-controle-sanitaire-de-leau-du-robinet/), la plateforme des données publiques françaises, qui fournit les résultats du contrôle sanitaire de l'eau du robinet. Ces données incluent divers indicateurs de qualité de l'eau, permettant une analyse approfondie de son évolution entre 2018 et 2024.
Les données principales utilisées pour ce projet sont des données sur les résultats du contrôle sanitaire de l'eau du robinet qui proviennent du site [**data.gouv.fr**](https://www.data.gouv.fr/fr/datasets/resultats-du-controle-sanitaire-de-leau-du-robinet/), la plateforme des données publiques françaises. Ces données incluent divers indicateurs de qualité de l'eau, permettant une analyse approfondie de son évolution entre 2018 et 2024.
D'autres données de la [Sandre](https://www.sandre.eaufrance.fr/v2/) et de [data.gouv.fr](https://www.data.gouv.fr/fr/datasets/communes-de-france-base-des-codes-postaux/) nous serviront à compléter ces données. (voir ci-après)
...
...
@@ -44,14 +44,14 @@ D'autres données de la [Sandre](https://www.sandre.eaufrance.fr/v2/) et de [dat
## Etat des lieux de la data
Pour chaque année, nous avons récupéré un fichier Zip sur [**data.gouv.fr**](https://www.data.gouv.fr/fr/datasets/resultats-du-controle-sanitaire-de-leau-du-robinet/) contenant entre autres un fichier csv contenant des informations sur les prélévements de l'année et un autre contenant les resultats de ces prélévements :
Pour chaque année, nous avons récupéré un fichier Zip sur [**data.gouv.fr**](https://www.data.gouv.fr/fr/datasets/resultats-du-controle-sanitaire-de-leau-du-robinet/) contenant entre autres un fichier csv contenant des informations sur les prélévements de l'année et un autre contenant les résultats de ces prélévements :
***UDI_PLV** : une ligne par prélèvement avec date, lieu, coordonnées, référence du prélèvement, etc
***UDI_RES** : une ligne par paramètres testé avec codes du paramètre, la valeur mesurée, référence du prélèvement, etc.
Il nous manquait alors une **table des correspondances** entre les paramètres et leurs codes d'identification (seule information disponible dans les fichiers de data.gouv), que nous avons trouvé sur le site de la [Sandre](https://www.sandre.eaufrance.fr/v2/)(Service d'administration nationale des données et référentiels sur l'eau), afin d'interpréter les codes présents dans les fichers.
Nous nous sommes aussi aperçu que les coordonnées des lieux étant encodées en **Lambert 93** et non en GPS, que certaines lignes n'avaient pas de coordonnées et même que d'autres avaient leurs coordonnées inversées.\
Pour les lignes sans coordonnées, nous nous sommes servis d'une base de données des communes françaises trouvée sur [data.gouv.fr](https://www.data.gouv.fr/fr/datasets/communes-de-france-base-des-codes-postaux/) pour compléter la data en ajoutant pour ces lignes les coordonnées GPS de la commune correspondante (à défaut de celles du point de prélèvement).
Pour les lignes sans coordonnées, nous nous sommes servis d'une base de données des communes françaises trouvée également sur [data.gouv.fr](https://www.data.gouv.fr/fr/datasets/communes-de-france-base-des-codes-postaux/) pour compléter la data en ajoutant pour ces lignes les coordonnées GPS de la commune correspondante (à défaut de celles du point de prélèvement).
## Prétraitement et choix des indicateurs
...
...
@@ -78,13 +78,15 @@ Grâce à une analyse de la littérature mais également de la densité nos donn
## Tables obtenues
Les tables obtenues (une par année) **à la suite de ce prétraitement** contiennent alors **une ligne par paramètre (sélectionnées selon notre intérêt) par prélèvement**, avec, entre autres, la date et la référence du prélèvement, le lieu (département, ville, point de surveillance, coordonnées gps) et la valeur du paramètre ainsi que son unité et son seuil.
Les tables obtenues (une par année) **à la suite de ce prétraitement** contiennent alors **une ligne par paramètre (sélectionnées selon notre intérêt) par prélèvement**, avec, entre autres, la date et la référence du prélèvement, le lieu (département, ville, point de surveillance, coordonnées gps) et la valeur du paramètre (`rsana`) ainsi que son unité.
PS : Les attributs de cette table ne seront finalement pas tous utilsés dans l'application finale. En effet, nous avons préparé le terrain pour pouvoir mener des analyses plus poussées (Cf. **6. Rendu final et ambition future**).
# 4. Calcul des scores de qualité de l'eau
Une fois la donnée propre et complète, il est alors possible de passer à une étape cruciale du projet, le calcul d'un score de qualité de l'eau.
Une fois la donnée propre et complète, il est alors possible de passer à une étape cruciale du projet, le calcul d'un score de qualité de l'eau.\
Selon nous, un **score**, bien qu'il soit factuellement moins juste qu'un taux de prélèvements (non-)conformes car soumis à une interprétation et à des choix dans son élaboration, est bien **plus parlant et plus impactant** dans un but de sensibilisation des populations.\
C'est pour cette raison que nous nous sommes intéressés à l'élaboration d'un modèle de calcul de score de qualite de l'eau.