Soutenance de thèse de Lucas Etourneau le 24/01/2024

La soutenance de thèse de Lucas Etourneau de l'équipe TIMC TrEE aura lieu le mercredi 24 janvier 2024 à 13h30, sur le thème :
 

"Contrôle du FDR et imputation de valeurs manquantes pour l'analyse des données de protéomique par spectrométrie de masse"

  • Lieu : Salle des thèses du bâtiment Boucherle, 5 Chemin Duhamel,
              Facultés de Médecine et Pharmacie, 38700 La Tronche

 

Jury :

  • Nataliya Sokolovska, Professeur des Universités, Sorbonne Université, .
  • Julie Josse, Advanced Researcher, INRIA, .
  • Adeline Leclercq-Samson, Professeur des Universités, Université Grenoble-Alpes, .
  • Guillaume Fertin, Professeur des université, Nantes Université, .
  • Quentin Giai-Gianetto, Ingénieur de recherche, Institut Pasteur, .

Encadrement :

  • Thomas Burger, Directeur de recherche, CNRS, Directeur de thèse
  • Nelle Varoquaux, Chargée de recherche, CNRS délégation Alpes, Codirectrice de thèse

bullet  Résumé

La protéomique consiste en la caractérisation du protéome d’un échantillon biologique, c’est-à-dire l’ensemble des protéines qu’il contient, et ce de la manière la plus exhaustive possible. Par l’identification et la quantification de fragments de protéines analysables en spectrométrie de masse (appelés peptides), la protéomique donne accès au niveau d’expression des gènes à un instant donné, ce qui est une information capitale pour améliorer la compréhension des mécanismes moléculaires en jeu au sein du vivant. Ces expériences produisent de grandes quantités de données, souvent complexes à interpréter et sujettes à certains biais. Elles requièrent des méthodes de traitement fiables et qui assurent un certain contrôle qualité, afin de garantir la pertinence des conclusions biologiques qui en résultent. Les travaux de cette thèse portent sur l'amélioration de ces traitements de données, et plus particulièrement sur les deux points majeurs suivants: Le premier est le contrôle du taux de fausses découvertes (abrégé en FDR pour “False Discovery Rate”), durant les étapes d’identification (1) des peptides, et (2) de biomarqueurs quantitativement différentiels entre une condition biologique testée et son contrôle négatif. Nos contributions portent sur l'établissement de liens entre les méthodes empiriques propres à la protéomique, et d’autres méthodes théoriquement bien établies. Cela nous permet notamment de donner des directions à suivre pour l’amélioration des méthodes de contrôle du FDR lors de l'identification de peptides. Le second point porte sur la gestion des valeurs manquantes, souvent nombreuses et de nature complexe, les rendant impossible à ignorer. En particulier, nous avons développé un nouvel algorithme d’imputation de valeurs manquantes qui tire parti des spécificités des données de protéomique. Notre algorithme a été testé et comparé à d’autres méthodes sur plusieurs jeux de données et selon des métriques variées, et obtient globalement les meilleures performances. De plus, il s’agit du premier algorithme permettant d’imputer en suivant le paradigme en vogue de la “multi-omique”: il peut en effet s’appuyer, lorsque cela est pertinent, sur des informations de type transcriptomique, qui quantifie le niveau d’expression des ARN messagers présents dans l’échantillon, pour imputer de manière plus fiable. Finalement, Pirat est implémenté dans un paquet logiciel disponible gratuitement, ce qui rend facilement utilisable pour la communauté protéomique.;