STAGE M2 (F/H) – Méthodologie Pharmacoépidémiologique & Real-World Evidence – Lyon

Heva, filiale de Docaposte et une expertise de La Poste Santé & Autonomie, est un acteur majeur de la valorisation des données de santé : de la collecte, à l’exploitation et la restitution des résultats.

Elle accompagne les professionnels de l’industrie pharmaceutique, du dispositif médical, les entreprises de biotechnologie ou encore et les institutionnels du secteur de la santé dans la gestion de tous types d’études sur données de santé.

Nous cherchons :
STAGE M2 (F/H) – Méthodologie Pharmacoépidémiologique & Real-World Evidence – Lyon

Titre : Robustesse des études comparatives en vie réelle : cartographie des témoins négatifs (Negative Control Outcomes) et calibration empirique dans le SNDS

Durée : 6 mois | Lieu : Lyon, France | Démarrage : Janvier 2027

  1. Contexte scientifique

Les études observationnelles d’efficacité et de sécurité comparatives constituent aujourd’hui le socle de la production de preuves en vie réelle (Real-World Evidence, RWE), qu’il s’agisse de décisions de remboursement, d’évaluations post-inscription ou d’études de pharmacovigilance active. Malgré le recours à des méthodes d’ajustement avancées — scores de propension, pondération par l’inverse de la probabilité de traitement (IPTW), appariement — un biais résiduel systématique persiste dans la quasi-totalité des études observationnelles, en raison notamment des facteurs de confusion non mesurés : biais d’indication, healthy user bias, fragilité non codée dans les bases médico-administratives.

L’approche par calibration empirique (Empirical Calibration), formalisée et popularisée par le consortium OHDSI dans le cadre du programme LEGEND, propose une réponse quantitative à ce défi. Le principe consiste à estimer la distribution empirique du biais résiduel en mesurant l’effet apparent du traitement sur une série d’événements témoins négatifs (Negative Control Outcomes, NCOs) — des événements cliniques pour lesquels toute relation causale avec le traitement est biologiquement non plausible. Si un signal apparaît sur ces témoins, il reflète nécessairement un biais systématique que l’on peut modéliser et corriger. Cette distribution de l’hypothèse nulle empirique est ensuite utilisée pour recalibrer l’estimateur et les intervalles de confiance de l’outcome d’intérêt.

Bien que la méthode soit désormais reconnue comme une bonne pratique méthodologique dans les grandes études de pharmacoépidémiologie internationale, son déploiement en routine sur des données françaises reste très limité. La principale raison tient à l’absence de cartographie structurée des NCOs adaptés aux spécificités du Système National des Données de Santé (SNDS) — codage CIM-10, CCAM, remboursements DCIR — et aux différentes aires thérapeutiques.

  1. Objectifs du stage

Le stage s’articule autour de deux axes complémentaires.

Axe méthodologique :

  • Réaliser une revue de portée (scoping review) des NCOs utilisés dans la littérature pharmacoépidémiologique,
  • Stratifiée par domaine thérapeutique (oncologie, cardiologie, diabétologie, infectiologie) et par population cible (sujet âgé, femme enceinte, patient immunodéprimé).
  • Cette cartographie aboutira à une matrice opérationnelle croisant candidats NCOs et faisabilité de leur transposition en algorithmes SNDS.

Axe appliqué :

Mettre en œuvre une preuve de concept (proof of concept) complète de calibration empirique sur un cas d’usage réel à partir du SNDS, en allant de la construction de cohorte jusqu’à la recalibration de l’estimateur principal.

  1. Missions

Phase 1 — Revue et cartographie des NCOs (mois 1–2)

Le stagiaire conduira une revue structurée de la littérature portant sur les pratiques de sélection des NCOs dans les publications pharmacoépidémiologiques majeures, en distinguant les approches de manual curation (sélection experte a priori) et les approches data-driven (extraction algorithmique à partir d’ontologies médicales ou de bases de pharmacovigilance).

Le livrable principal de cette phase est une matrice NCOs × domaines thérapeutiques, incluant pour chaque candidat NCO : le niveau de preuve de l’absence d’effet biologique, la faisabilité de codage dans le SNDS (codes CIM-10 / CCAM identifiés), la sensibilité attendue dans les données de remboursement, et les limites potentielles (sous-codage, variabilité inter-établissements). Ce document est conçu pour être réutilisable dans les futurs protocoles d’étude et opposable aux autorités d’évaluation (HAS, EMA).

Phase 2 — Design du cas d’usage et extraction de données (mois 3)

Un cas d’usage sera défini en concertation avec l’équipe encadrante, en s’appuyant sur des études récentes du bureau d’étude en cours ou achevées pour lesquelles une réanalyse méthodologique apporte une plus-value scientifique. La question de recherche sera formalisée en format PICO et le protocole d’étude adapté aux contraintes de l’ESND/SNDS (effectifs, durée de suivi disponible, couverture des variables d’ajustement). La cohorte sera déjà construite à partir des tables DCIR et PMSI MCO. Il sera nécessaire d’ajouter les variables nécessaires à l’analyse proposée dans le stage.

Phase 3 — Analyse statistique et calibration (mois 4–5)

Les facteurs de confusion mesurés seront ajustés par des méthodes à base de score de propension. L’outcome principal ainsi que le panel de NCOs sélectionnés en Phase 1 seront estimés à l’aide modèles de régressions adaptés, afin de modéliser la distribution empirique de l’hypothèse nulle et de recalibrer les estimateurs de l’étude.

Phase 4 — Synthèse et valorisation (mois 6)

Le stagiaire rédigera son mémoire (structure IMRaD) et produira un script R / python documenté, couvrant l’ensemble de la chaîne analytique, destiné à être intégré aux workflows standard du bureau. Un abstract/poster sera préparé en vue d’une soumission à un congrès de pharmacoépidémiologie (ISPE, DSVR ou EMOIS selon le calendrier).

  1. Profil recherché

Le stage s’adresse à un(e) étudiant(e) en deuxième année de Master en Biostatistiques, Épidémiologie ou Santé Publique, avec une appétence marquée pour les questions de validité interne et d’inférence causale en études observationnelles.

Une expérience avec les bases de données de santé françaises (SNDS/EGB/ESND) et une bonne maîtrise de SAS / R / Python constitue un atout significatif. La capacité à lire et synthétiser la littérature méthodologique en anglais est attendue.

Au-delà des compétences techniques, le profil recherché est celui d’un esprit rigoureux et critique, capable de questionner ses propres résultats et d’identifier les sources potentielles d’artéfact avant d’en tirer des conclusions. Une certaine autonomie de recherche est attendue dès la Phase 1, tout en s’inscrivant dans un fonctionnement d’équipe.

Vos conditions de travail :

Le stagiaire sera intégré à l’équipe d’épidémiologie et bénéficiera d’un encadrement direct par un pharmacoépidémiologiste (Benjamin GRENIER). Les analyses s’effectueront sur un environnement sécurisé conforme aux exigences du RGPD et aux référentiels de sécurité de la CNIL (données pseudonymisées). La gratification est conforme à la réglementation en vigueur.

Merci d’envoyer votre dossier de candidature (CV+ lettre de motivation) à benjamin.grenier@heva-data.com.