Select Git revision
INF-TC1-td04.ipynb
Forked from
Vuillemot Romain / INF-TC1
Source project has a limited visibility.
-
Romain Vuillemot authoredRomain Vuillemot authored
classement_param.py 1.33 KiB
# Fonction d'exploration des données : compte le nombre d'un panel de paramètres sélectionnés suite à nos recherches (ARS, OMS, ...)
# i.e. combien de prélèvements comportent ces paramètres : est-ce qu'ils sont beaucoup testés
# ici dans la Table des résultats de l'année 2024 (1ère année que nous avons exploré)
# nous a servi pour choisir notre panel de paramètres pour notre étude et notre calcul de scores
import pandas as pd
parametres_a_filtrer = {
'1302.0', # pH
'1382.0', # plomb
'1386.0', # nickel
'1387.0', # mercure
'1388.0', # cadmium
'1369.0', # arsenic
'1339.0', # nitrites
'1340.0', # nitrates
'1399.0', # chlore
'1314.0', # DCO
'1313.0', # DBO5
'7009.0', # indice hydrocarbures
'6275.0', # trihalométhanes
'6276.0', # pesticides
'1059.0' # bactériophages fécaux
}
def count_filtered_occurrences(csv_file):
df = pd.read_csv(csv_file)
occurrences = df['cdparametre'].value_counts()
occurrences = occurrences.reindex(parametres_a_filtrer, fill_value=0)
return occurrences
if __name__ == "__main__":
csv_file = "data/processed/Table2024_normalized.csv"
occurrences = count_filtered_occurrences(csv_file)
print("Occurrences des paramètres sélectionnés :")
for param, count in occurrences.items():
print(f"{param} : {count}")