Développements méthodologiques pour la caractérisation de l'hétérogénéité tumorale - Archive ouverte HAL Accéder directement au contenu
Thèse Année : 2021

Methodological developments for the characterization of tumor heterogeneity

Développements méthodologiques pour la caractérisation de l'hétérogénéité tumorale

Résumé

Cancer is a complex disease in which each tumor is different in terms of the genetic mutations, the expression of genes, or the composition of cell types. These numerous factors play a determining role in the response to treatments and the survival of patients. During my thesis, I developed innovative methods based on different types of omics data in order to better characterize tumor heterogeneity at these different scales, thus allowing a better understanding of individual tumors, with the possibility of implementing personalized medicine strategies.The first part of my thesis focused on the development of a personalized differential analysis method. This method allows to infer deregulated genes at the scale of a single tumor from transcriptomic data. Using this method, I characterized inter-tumor (between individuals) heterogeneity in lung cancer. We were able to isolate genes of interest, such as "super-conserved" genes (whose expression never varies between patients) or systematically deregulated genes, and also to discover new tumor subtypes related to patient survival and to infer associated biomarkers.In the second part, I was interested in intra-tumor heterogeneity, i.e. the cell type composition of a given tumor, which contains both cancer cells and microenvironment cells (immune cells, stroma, healthy cells). The goal here is to infer this composition from omics data (transcriptomic and DNA methylation) obtained on the whole tumor. For this purpose, we organized a first multi-disciplinary data challenge to explore different reference-free deconvolution methods based on methylation data and to evaluate the interest of pre-processing the data. We derived a comparative analysis of existing methods, as well as a best practice guide for the use of deconvolution to infer tumor heterogeneity. We then explored the integration of two types of data (RNA seq and methylation) in a second data challenge that led to the implementation of a benchmarking platform.Finally, the third part of my thesis links the first two parts. By combining deconvolution and differential analysis, I developed an algorithm that allows to infer gene deregulation in cancer cells only, and to associate this deregulation to the composition of the tumor microenvironment. After extensive study of the different parameters of the method on simulation sets, this approach should make it possible to identify genes whose deregulation in cancer plays a role in the organization of the tumor microenvironment, thus opening the door to the possibility of identifying new biomarkers of heterogeneity that could be related to the virulence of cancer, and thus overall to obtain a better understanding of the biological mechanisms involved.
Le cancer est une maladie complexe où chaque tumeur est différente, aussi bien au niveau des mutations génétiques présentes, de l’expression des gènes, ou de la composition en types cellulaires. Ces nombreux facteurs jouent un rôle déterminant dans la réponse aux traitements et la survie des patients. Durant ma thèse, j’ai développé des méthodes innovantes basées sur différents types de données omiques afin de mieux caractériser l'hétérogénéité tumorale à ces différentes échelles, permettant ainsi une meilleure compréhension individuelle des tumeurs, avec à terme la possibilité de mettre en place des stratégies de médecine personnalisée.La première partie de ma thèse s’est concentrée sur le développement d’une méthode d’analyse différentielle personnalisée. Cette méthode permet d’inférer les gènes dérégulés à l’échelle d’une tumeur unique à partir de données transcriptomiques. A l’aide de cette méthode, j’ai caractérisé l’hétérogénéité inter-tumorale (entre individus) dans le cancer du poumon. Nous avons ainsi pu isoler des gènes d’intérêts, comme des gènes "super-conservés" (dont l’expression ne varie jamais entre les patients) ou bien des gènes systématiquement dérégulés, et également découvrir de nouveaux sous-types tumoraux liés à la survie des patients ainsi qu'inférer les biomarqueurs associés.Dans la deuxième partie, je me suis intéressé à l’hétérogénéité intra-tumorale, c’est-à-dire à la composition en types cellulaires d’une tumeur donnée, qui contient à la fois des cellules cancéreuses et des cellules du microenvironnement (cellules immunitaires, stroma, cellules saines). Le but est ici d’inférer cette composition à partir de données omiques (transcriptomique et méthylation de l’ADN) obtenues sur la tumeur entière. Pour cela, nous avons organisé un premier data challenge multi-disciplinaire pour explorer différentes méthodes de déconvolution dites sans référence qui se basent sur les données de méthylation et évaluer l'intérêt du pré-traitement des données. Nous en avons tiré une analyse comparative des méthodes existantes, ainsi qu'un guide des bonnes pratiques quant à l'utilisation de la déconvolution pour inférer l'hétérogénéité tumorale. Nous avons ensuite exploré l'intégration de deux types de données (RNA seq et méthylation) dans un second data challenge qui a notamment débouché sur la mise en place d'une plateforme de benchmarking.Enfin, la troisième partie de ma thèse fait le lien entre les deux premières. En associant la déconvolution et l’analyse différentielle, j’ai développé un algorithme qui permet d’inférer la dérégulation des gènes dans les cellules cancéreuses uniquement, et d’associer cette dérégulation à la composition du microenvironnement tumoral. Après l'étude poussée des différents paramètres de la méthode sur des jeux de simulations,  cette approche devrait permettre de déterminer des gènes dont la dérégulation dans le cancer joue un rôle dans l’organisation du microenvironnement tumoral, ouvrant ainsi la porte à la possibilité d'identifier de nouveaux biomarqueurs de l'hétérogénéité qui pourraient être en lien avec la virulence du cancer, et ainsi globalement d'obtenir une meilleure compréhension des mécanismes biologiques impliqués.
Fichier principal
Vignette du fichier
DECAMPS_2021_archivage.pdf (26.58 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03601942 , version 1 (08-03-2022)

Identifiants

  • HAL Id : tel-03601942 , version 1

Citer

Clémentine Decamps. Développements méthodologiques pour la caractérisation de l'hétérogénéité tumorale. Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Grenoble Alpes [2020-..], 2021. Français. ⟨NNT : 2021GRALS026⟩. ⟨tel-03601942⟩
540 Consultations
54 Téléchargements

Partager

Gmail Facebook X LinkedIn More