diff --git a/src/tests/classement_dpt.py b/src/tests/classement_dpt.py index 3ec21e05d82b5594d30c4a54c782d1eae2ea0ea6..6b7afae3aabd6d6eb5b52eba33c35442538711bc 100644 --- a/src/tests/classement_dpt.py +++ b/src/tests/classement_dpt.py @@ -1,15 +1,15 @@ +# Fonction d'exploration des données : compte le nombre d'occurences de chaque département (i.e. combien de prélèvements par départements) +# ici dans la Table des résultats de l'année 2024 (1ère année que nous avons exploré) +# nous a servi à voir si la répartition des prélèvements était plutôt uniforme nationalement, découverte du jeu de données + import pandas as pd def count_occurrences(csv_file): - # Read the CSV file df = pd.read_csv(csv_file) - - # Count occurrences of each value in the 'cdparametre' column occurrences = df['cddept_x'].value_counts() - return occurrences if __name__ == "__main__": - csv_file = "data/processed/Table2024.csv" # Replace with your CSV file path + csv_file = "data/processed/Table2024.csv" occurrences = count_occurrences(csv_file) print(occurrences) \ No newline at end of file