Skip to content
Snippets Groups Projects
Select Git revision
  • 86731912d4efb128bf9116684a37f3d9156a40b5
  • main default protected
  • gh-pages
  • new_data_processing
  • dev-lucas
5 results

classement_param.py

Blame
  • classement_param.py 1.33 KiB
    # Fonction d'exploration des données : compte le nombre d'un panel de paramètres sélectionnés suite à nos recherches (ARS, OMS, ...) 
    # i.e. combien de prélèvements comportent ces paramètres : est-ce qu'ils sont beaucoup testés
    # ici dans la Table des résultats de l'année 2024 (1ère année que nous avons exploré)
    # nous a servi pour choisir notre panel de paramètres pour notre étude et notre calcul de scores
    
    import pandas as pd
    
    parametres_a_filtrer = {
        '1302.0', # pH
        '1382.0', # plomb
        '1386.0', # nickel
        '1387.0', # mercure
        '1388.0', # cadmium
        '1369.0', # arsenic
        '1339.0', # nitrites
        '1340.0', # nitrates
        '1399.0', # chlore
        '1314.0', # DCO
        '1313.0', # DBO5
        '7009.0', # indice hydrocarbures
        '6275.0', # trihalométhanes
        '6276.0', # pesticides
        '1059.0'  # bactériophages fécaux
    } 
    
    def count_filtered_occurrences(csv_file):
        df = pd.read_csv(csv_file)
        occurrences = df['cdparametre'].value_counts()
        occurrences = occurrences.reindex(parametres_a_filtrer, fill_value=0)
        return occurrences
    
    if __name__ == "__main__":
        csv_file = "data/processed/Table2024_normalized.csv"
        occurrences = count_filtered_occurrences(csv_file)
        print("Occurrences des paramètres sélectionnés :")
        for param, count in occurrences.items():
            print(f"{param} : {count}")