Soutenance de thèse de Basile JUMENTIER le 09/06/22


La soutenance de thèse de Basile JUMENTIER de l'équipe TIMC BCM aura lieu le jeudi 9 juin 2022 à 14h sur le thème :

« Analyse de la médiation des effets d’expositions environnementales sur la santé via la méthylation de l’ADN : Application à l’exposition prénatale au tabagisme et à la pollution atmosphérique et la santé de l’enfant »
 

bullet Jury :

  • Olivier FRANÇOIS, Enseignant Chercheur, Grenoble INP-Université Grenoble Alpes, Directeur
  • Johanna LEPEULE, Chercheuse, INSERM U1209-Environmental epidemiology, Grenoble, Co-directrice
  • Vivian VIALLON, Maître de Conférence, Université Claude Bernard Lyon, Rapporteur
  • Mathieu EMILY, Professeur, Institut Agro - Agrocampus Ouest, Rapporteur
  • Vincent BONNETERRE, Professeur des Universités - Praticien Hospitalier, Université Grenoble Alpes, Examinateur
  • Magali RICHARD, Maîtresse de Conférence, Université Grenoble Alpes, Examinatrice

 

bullet  Mots clés :  

Médiation haute dimension, Exposition prénatale, Santé de l'enfant

bullet Résumé :

L'analyse de médiation à haute dimension est une extension de l'analyse de médiation unidimensionnelle qui inclut plusieurs médiateurs et est de plus en plus utilisée en épidémiologie environnementale pour évaluer les effets épigénétiques indirects des expositions environnementales sur les résultats de santé. Cependant, les analyses impliquant des données de grande dimension soulèvent plusieurs problèmes statistiques. Bien que de nombreuses méthodes aient été récemment développées pour résoudre ces problèmes, aucun consensus n'a été atteint sur une combinaison optimale d'approches. Pour mieux appréhender la problématique de médiation en haute dimension, le premier chapitre de thèse ce focalise sur les études d’associations tel que les EWAS et les GWAS. Les associations de phénotypes ou d'expositions avec des données génomiques et épigénomiques se heurte à d'importants défis statistiques. L'un de ces défis consiste à tenir compte de la variation due à des facteurs de confusion non observés, tels que l'ascendance individuelle ou la composition du type cellulaire dans les tissus. Ce problème peut être résolu avec des modèles de régression à facteurs latents pénalisés, où des pénalités sont introduites pour faire face à une dimension enlevée dans les données. Si une proportion relativement faible de marqueurs génomiques ou épigénomiques est corrélée à la variable d'intérêt, les pénalités de parcimonie (sparse) peuvent aider à capturer les associations pertinentes, mais l'amélioration par rapport aux approches non parcimonieuses n'a pas encore été entièrement évaluée. Ici, nous présentons un algorithme des moindres carrés qui estime conjointement les tailles d'effet et les facteurs de confusion dans des modèles de régression à facteurs latents parcimonieux (sparse). Cet algorithme a pu être validé dans un contexte de simulation. Nous avons appliqué notre méthode à une étude d'association à l'échelle du génome d'un trait de floraison de la plante Arabidopsis thaliana et à une étude d'association à l'échelle de l'épigénome du statut tabagique chez les femmes enceintes. Pour les deux applications, les modèles de régression à facteurs latents parcimonieux ont facilité l'estimation des tailles d'effet non nulles tout en surmontant les problèmes de tests multiples. Les résultats étaient non seulement cohérents avec les découvertes précédentes, mais ils ont également identifié de nouveaux gènes avec des annotations fonctionnelles pertinentes pour chaque application. Dans le second chapitre, nous avons développé HDMAX2, une nouvelle approche en plusieurs étapes de médiation qui combine des modèles de régression des facteurs latents pour les études d'association à l'échelle de l'épigénome avec des tests de médiation (test du maximum au carré). HDMAX2 à été́ soigneusement évaluée à partir de simulations et comparée à des méthodes de médiation en haute dimension. Ensuite, HDMAX2 a été utilisé pour évaluer les effets indirects de l'exposition au tabagisme maternel sur le poids à la naissance à terme et l'âge gestationnel à l'accouchement dans une étude portant sur 470 femmes de la cohorte mère enfant EDEN. HDMAX2 a permis de détecter des régions non identifiées dans les analyses de médiation précédentes de l'exposition au tabagisme sur le poids de naissance. Les résultats ont fourni des preuves d'une architecture polygénique de la voie causale avec un effet indirect global de 44 g de poids corporel inférieur (31 % de la taille de l'effet total). HDMAX2 a également identifié des régions ayant des effets simultanés à la fois sur l’âge gestationnel et sur le poids de naissance. Parmi les principaux résultats des analyses de l’âge gestationnel et du poids de naissance, les régions situées sur les gènes COASY et BLCAP ont également médié la relation entre l’âge gestationnel et le poids de naissance, suggérant une causalité inverse dans la relation entre l’âge gestationnel et le méthylome.