diff --git a/src/tests/classement_param.py b/src/tests/classement_param.py index f2dba3c297f50531f0331eaae3f404eac42e3bee..20898dd91a3a5c8777e82aa5433aeeb096e41e84 100644 --- a/src/tests/classement_param.py +++ b/src/tests/classement_param.py @@ -1,3 +1,8 @@ +# Fonction d'exploration des données : compte le nombre d'un panel de paramètres sélectionnés suite à nos recherches (ARS, OMS, ...) +# i.e. combien de prélèvements comportent ces paramètres : est-ce qu'ils sont beaucoup testés +# ici dans la Table des résultats de l'année 2024 (1ère année que nous avons exploré) +# nous a servi pour choisir notre panel de paramètres pour notre étude et notre calcul de scores + import pandas as pd parametres_a_filtrer = { @@ -19,22 +24,14 @@ parametres_a_filtrer = { } def count_filtered_occurrences(csv_file): - # Lire le fichier CSV - df = pd.read_csv(csv_file, dtype={'cdparametre': str}) # S'assurer que les codes sont traités comme des chaînes - - # Compter les occurrences des paramètres filtrés + df = pd.read_csv(csv_file) occurrences = df['cdparametre'].value_counts() - - # Ajouter les paramètres manquants avec 0 occurrence occurrences = occurrences.reindex(parametres_a_filtrer, fill_value=0) - return occurrences if __name__ == "__main__": - csv_file = "data/processed/Table2024_normalized.csv" # Remplacez par votre chemin de fichier + csv_file = "data/processed/Table2024_normalized.csv" occurrences = count_filtered_occurrences(csv_file) - - # Affichage des résultats avec le format souhaité print("Occurrences des paramètres sélectionnés :") for param, count in occurrences.items(): print(f"{param} : {count}") \ No newline at end of file