DME Projet Data Antibiotiques | Portfolio - Magali Vandenplas Skip to the content.

Analyse ad-hoc :
Consommation des antibiotiques en France 2019-2024

(Projet de groupe retravaillé)

Contexte

« L’utilisation répétée et inadaptée des antibiotiques a favorisé l’apparition de bactéries résistantes à ces médicaments. Résultat : certaines infections deviennent de plus en plus difficiles à soigner. » Source

Ainsi la surveillance et la compréhension de la prescription et délivrance des antibiotiques en France est un des moyens de contribuer à des actions de prévention et d'appuyer les politiques de santé publique sur l'usage raisonné des antibiotiques.

Visuel bon usage des antibiotiques

Antibiotiques et antibiorésistance

(Source image)


N'hésitez pas à consulter le glossaire.

Stack

Python, PowerBI


En étudiant les données de remboursement (montants remboursés, nombre de boîtes délivrées) selon les axes prescripteur, bénéficiaire, sous-groupe pharmacologique, on cherche à répondre aux questions suivantes :

  • Quelles sont les tendances de consommation sur la période étudiée selon les caractéristiques démographiques, territoriales et les familles d'antibiotiques ?
  • Quels critères ou territoires présentent des dynamiques de consommation atypiques ou remarquables ?
  • Quelles interactions existent entre les différents facteurs analysés ?
  • Quelle est la part des substances surveillées pour l’antibiorésistance parmi l’ensemble des antibiotiques délivrés en ville ?

Note

"Ces données de remboursement [données SNDS] sont utilisées comme proxy de la consommation française, faisant l’hypothèse d’une part que toutes les prescriptions donnent lieu à remboursement, et d’autre part que l’ensemble des médicaments remboursés par l’Assurance maladie ont été consommés par les patients concernés." Synthèse préliminaire des indicateurs disponibles sous Géodes (11-2020)

▶ Pour une approche alignée en unités avec les objectifs posés dans la stratégie nationale 2022-2025 de prévention des infections et de l'antibioresistance, exprimés en doses définies journalières (DDJ) pour 1 000 habitants et par jour, et en prescriptions pour 1 000 habitants et par an, voir le Rapport de Santé publique France (11-2025).

▶ La notion de proxy implique que les principales tendances sont perceptibles dès une première analyse des données de remboursement, même si ces données ne suffisent pas à elles seules pour mener une analyse approfondie et exhaustive.

▶ Compte tenu des contraintes de temps du projet, l'étude concerne uniquement l'analyse des données de remboursement Open Medic, visant à identifier les tendances majeures et à proposer des indicateurs complémentaires aux DDJ et aux prescriptions, en particulier sur la nature et le prix des médicaments.

Source principale

  • Base Open Medic (données SNDS) mise à disposition librement par l’État sur la plate-forme data.gouv.fr
    • Dépenses de médicaments/remboursements délivrés en pharmacies de ville, selon des groupes d’éléments descriptifs bénéficiaires (tranche d'âge, sexe, région de résidence), spécialité prescripteur, type de médicament, par année.
    • Structuré selon la classification hiérarchique ATC (Anatomique, Thérapeutique et Chimique) des médicaments
    • Mise à disposition annuelle
    • Utilisation de la base principale pour les années 2019 à 2024 : 6 fichiers open_medic_AAAA.csv
    • Antibiotiques identifiés par le code ATC2 : J01-ANTIBACTERIENS A USAGE SYSTEMIQUE

Aperçu données Open Medic

Aperçu des données - Base principale Open Medic

Sources complémentaires/Contexte

  • Fichier INSEE (Institut national de la statistique et des études économiques)

  • Liste PRIMO

    • Liste des substances antibiotiques surveillées en France dans le cadre de la mission PRIMO sur l'antibiorésistance
  1. Analyse des variables et listes de valeurs, définition des formats et listes cibles

  2. Chargement initial

    • Import des 6 fichiers zips csv (Python)
    • Gestion de l'encodage
    • Gestion des formats de variables (colonnes)
    • Ajout et valorisation d'une colonne année
    • Normalisation des noms de colonnes
    • Concaténation des 6 fichiers
    • Contrôle des doublons
    • Contrôle des volumétries et valeurs manquantes

      Volumes - état initial

      Volumes après concaténation - état initial

      Valeurs manquantes - état initial

      Valeurs manquantes après concaténation - état initial

  3. Filtrage

    • Filtrage du dataframe sur ATC2='J01' de façon à ne conserver que le périmètre des antibiotiques
    • Contrôle des volumétries et valeurs manquantes

      Volumes J01

      Volumes et valeurs manquantes après filtrage

  4. Adaptation des variables

    • Suppression des variables non pertinentes
    • Renommage plus explicite des variables
    • Ajout de variables libellés en vue de la gestion des visualisations d'exploration
    • Transcodage de valeurs catégorielles
      • Exemple cas particulier du top générique, dont la codification a changé au cours de la période étudiée

        Codage Top Générique issu de la documentation du jeu de données

        Codage Top Générique issu de la documentation du jeu de données

        Codage Top Générique normalisé

        Codage Top Générique normalisé

  5. Variable indiquant si la substance est surveillée ou non pour l'antibiorésistance (merge avec la liste mission PRIMO)

    • Ajout

      Ajout variable PRIMO

      Ajout variable liste Primo (merge)

    • Valorisation des valeurs manquantes liste primo à false, après vérification des lignes concernées

      Gestion NA liste Primo

      Gestion NA liste Primo

  6. Gestion des valeurs négatives

    • Identifiées via la méthode describe (min) et documentées sur la discussion Open Medic (il s'agit de régularisations de remboursements)

      describe

      Describe valeurs quantitatives

      traitement montants négatifs

      Traitement montants négatifs

      traitement montants négatifs res

      Traitement montants négatifs-résultat

    • Supprimées car en proportion très petite et non pertinentes pour les visualisations

  7. Vérification des outliers

    • On constate une grande dispersion à droite des données quantitatives : on étudie les outliers et la proportion qu'ils représentent. Ce ne sont pas des valeurs aberrantes; ils doivent être conservés.

      outliers

      Etude des outliers

  8. Gestion des valeurs inconnues
    • Le jeu de données ne comporte pas de NA mais des valeurs renseignées à "Inconnu".
    • Les valeurs inconnues (catégorielles) des différents critères sont introduites pour préserver le secret statistique lors qu'un groupe concerne moins de 10 bénéficiaires.
    • Le remplacement par le mode par exemple créerait beaucoup d'approximation, notamment lorsqu'une ligne/un groupe présente plusieurs critères inconnus.
    • Contrôle de la proportion de lignes concernées : on conserve les lignes qui seront filtrées au besoin pour les visualisations

  9. Valeurs inconnues

    Pourcentages des valeurs inconnues

  10. Vérification finale des doublons et valeurs manquantes

  11. Résultats du traitement

Informations du jeu de données après traitements

Informations du jeu de données après traitements

  • Fichier INSEE
    • Regroupement chiffres régions PACA et Corse pour aligner sur la répartition Open Medic
    • Regroupement chiffres tranches d'âge pour aligner sur la répartition Open Medic
    • Concaténation des 6 onglets (1 par année) en un seul avec ajout de la colonne année
    • Normalisation des valeurs Régions, sexe et tranche d'âge (iso Open Medic)

      Aperçu des données INSEE brutes

      Aperçu des données INSEE brutes (exemple année 2024)


Aperçu des données INSEE après traitement

Aperçu des données INSEE après traitement

  • Liste PRIMO
    • Récupération des codes ATC5 pour les substances de code ATC3 égal à J01 (antibiotiques)
    • Valorisation d'un booléen à True si la substance ATC5 est surveillée (voir ci-dessus étape 5 traitement fichier Open Medic)

On met en place un modèle en constellation (2 étoiles aux dimensions communes) :


modèle

Modèle Power BI

  • Table des remboursements : Table de faits
  • Tables de dimension : Age, sexe, région bénéficiare, Prescripteur, Année, Antibiotique
  • Table Insee : Traitée comme une table de faits pour appliquer les dimensions région, année, age, sexe et exploiter les chiffres de population segmentée.
  • Table de mesures DAX

Exploration préalable (Python) - exemples

  • Le montant remboursé et la base de remboursement ont une relation linéaire (coefficient taux de remboursement).

    relation linéaire

    Relation linéaire Montant remboursé/Base de remboursement

  • Le montant remboursé (ou la base de remboursement) et le nombre de boîtes délivrées ont une corrélation statistique positive forte mais n'ont pas une relation linéaire. Il est donc intéressant/complémentaire d'observer les comportements de ces 2 variables sur les mêmes critères.

    correlations

    Matrice de corrélations


    non linéaire

    Relation non linéaire Montant remboursé/Nombre de boîtes délivrées

Tendance globale

  • Ce rapport présente les éléments clés et les KPIs généraux qui seront déclinés dans les autres rapports sous les axes de prescription, remboursement et familles d'antibiotiques.

non linéaire

Rapport Vision globale

Variations

  • L'année 2020, avec le Covid, est marquée par une baisse du nombre de boîtes consommées comme des montants remboursés. Suit une hausse progressive de 2021 à 2022 puis une légère inflexion en 2023.

  • Si, sur l'ensemble de la période étudiée, la tendance globale est à la baisse pour le nombre de boîtes consommées comme pour les montants remboursés, la tendance est à la hausse sur ces 2 indicateurs pour la dernière année.

La mise en place, en 2022, de la stratégie nationale de prévention des infections et de l'antibiorésistance peut expliquer l'inflexion observée en 2023 ; toutefois, ses effets ne semblent pas se maintenir dans le temps au regard de ces indicateurs.

  • On remarque que seuls les médicaments non-génériques affichent une réelle baisse sur 2019-2024 avec une nette baisse entre 2021 et 2022 et une tendance plutôt stable sur 2023-2024.

Les nouvelles règles relatives au remboursement des médicaments non-génériques (indexation sur le prix du générique équivalent, souvent inférieur, sauf si non substituable) entrées en vigueur au 01/01/2021 semblent se traduire par une baisse de consommation des antibiotiques non-génériques.

PBI_global

Rapport Vision globale

Disparités régionales

  • Si l'Île-de-France est en tête des montants remboursés en valeur sur la période étudiée, ce sont globalement les regions PACA-Corse qui remboursent le plus (montant pour 1000 habitants).

Prescripteurs

  • Ce rapport aborde les indicateurs selon l'axe de la prescription et met en évidence :
    • La dominance, tant sur le nombre de boîtes délivrées que sur les montants remboursés, de 3 types de prescripteurs avec largement en tête les médecins généralistes libéraux.
    • Des diparités régionales et par tranche d'âge

PBI_prescripteurs

Rapport Prescripteurs

Type de prescripteur et répartition des montants

  • Le top 3 des prescripteurs représente plus de 90% des prescriptions, en montant remboursé comme en nombre de boîtes délivrées.

  • Au sein de ce top 3, les médecins généralistes libéraux dominent largement, quels que soient le critère, la région ou l'année. De même le 2ème rang est toujours occupé par les prescripteurs salariés (établissements de santé/hôpitaux) et le 3ème par la chirurgie dentaire (1 exception cependant pour les 0-19 ans avec la Pédiatrie libérale en 3ème position).

PBI_prescripteurs_tooltip_age

Détail Prescripteurs 0-19 ans

Disparités régionales

  • On observe que la répartition sur le territoire en nombre de boîtes pour 1000 habitants varie fortement selon la spécialité du prescripteur, notamment ceux du top 3.

PBI_prescripteurs

Rapport Prescripteurs - détail médecine générale 2024

PBI_prescripteurs

Rapport Prescripteurs - détail Prescripteurs salariés 2024

PBI_prescripteurs

Rapport Prescripteurs - détail Chirurgiens dentistes 2024

Remboursements et prix des antibiotiques

  • Ce rapport aborde l'axe de la charge financière représentée par les remboursements. Il introduit la notion de prix du médicament avec l'indicateur du Montant moyen remboursé par boîte et la aleur moyenne par type de médicament de la base de remboursementv.

PBI_remboursements

Rapport Remboursements

Impact du type de médicament

  • La base de remboursement est toujours plus élevée pour les non-génériques et référents que pour les génériques, comme le montant remboursé moyen (valable sur toute la période comme sur la dernière année 2024).

  • La part des médicaments génériques, moins chers, dans les montants remboursés a augmenté sur la période étudiée dans son ensemble ainsi que sur la dernière année :

    • Part génériques 2019 : 56,49%
    • Part génériques 2023 : 65,51%
    • Part génériques 2024 : 67,2%

Disparités régionales

  • Les régions PACA-Corse et d'Outre-mer ont les montants moyens remboursés par boîte les plus élevés, avec cependant une tendance à la baisse (tous types de médicaments confondus) . La région Centre-Val de Loire a le montant le plus bas.

Pour les non-génériques seuls, la tendance est à la hausse sur cet indicateur.

PBI_remboursements_ng2024

Rapport Remboursements non génériques 2024

  • Les régions PACA-Corse et Hauts-de-France sont celles où le montant remboursé par habitant est le plus élevé. A l'opposé on trouve les régions Auvergne-Rhône-Alpes et Centre-Val de loire.

Répartition prescripteurs

  • On observe une répartition similaire à celle du nombre de boîtes pour le top 3 prescripteurs, avec le même type d'évolution :
    • Dominance de la médecine générale libérale sur les prescripteurs salariés et les chirurgiens dentistes (pédiatrie libérale pour les 0-19 ans)
    • Progression dans le temps de la part des prescripteurs salariés dans le top 3

NB : Les Prescripteurs de ville en 2019 incluent les dentistes, qui en sont isolés à partir de 2020. Leur part est donc relativement stable.

Sexe bénéficiaire

  • Les montants remboursés sont globalement plus élévés par habitant pour le sexe féminin mais de façon plus équilibrée sur les 0-19 ans.

PBI_remboursements_0-19-2024

Rapport Remboursements 0-19 ans 2024

Familles consommées et part des substances surveillées

  • Ce rapport aborde les indicateurs selon l'axe des sous-groupes pharmacologiques (famille d'antibiotiques).

PBI_familles_antibio

Rapport Sous-groupes pharmacologiques

Familles dominantes

  • Le top 3 est dominé tous critères confondus par les Bêtalactamines-Pénicillines, Macrolides et Autres bêtalactamines ( ex : céphalosporines), en nombre de boîtes comme en montant remboursé.
  • L'ordre entre les 2 premières familles varie selon les critères ci-après mais la 3ème place ne change pas.

Impact de la tanche d'âge du bénéficiaire

  • Pour la tranche d'âge des 60 ans et +, la famille des macrolides devance les bêtalactamines en montant remboursé. (thérapies plus ciblées)

  • Pour la tranche d'âge des 0-19 ans, le top 3 des familles atteint plus de 80% des montants remboursés pour 75 à 76% sur les autres tranches d'âge.

PBI_familles_antibio 0-19 2024

Rapport Sous-groupes pharmacologiques - 0-19 ans - 2024

Spécificités régionales

  • Pour les régions PACA-Corse et Grand-Est, la famille des macrolides est en tête du top 3 au global en montant remboursé (toujours 2ème pour le nombre de boites délivrées), pas seulement pour les plus de 60 ans.

PBI_familles_antibio PACA-Corse

Rapport Sous-groupes pharmacologiques - PACA-Corse

Impact du type de médicament et prix moyen par famille

  • La base de remboursement moyenne par boîte est toujours plus élevée (environ x3,5) pour la famille des macrolides que pour la famille des bêtalactamines-pénicillines.

C'est un facteur d'explication du fait que l'écart en montant des remboursements entre les bêtalactaminespénicillines et macrolides est beaucoup moins grand que l'écart en nombre de boîtes délivrées pour les 2 familles (visibles sur les barres de top 3).

Substances surveillées pour l'antibiorésistance

  • L'amoxicilline représente environ 75% des boîtes délivrées sur l'ensemble de la période (proportion équivalente pour 2024), atteignant plus de 90% pour les 0-19 ans en 2024.

  • Les substances surveillées sont majoritaires (en nombre de boîtes délivrées).