Laboratory Publications
Addressing Background Genomic and Environmental Effects on Health through Accelerated Computing and Machine Learning: Results from the 2025 Hackathon at Carnegie Mellon University - Archive ouverte HAL
Pré-Publication, Document De Travail Année : 2025

Addressing Background Genomic and Environmental Effects on Health through Accelerated Computing and Machine Learning: Results from the 2025 Hackathon at Carnegie Mellon University

Siddharth Sabata
  • Fonction : Auteur
Rishika Gupta
Lars Warren Ericson
  • Fonction : Auteur
Halimat Chisom Atanda
  • Fonction : Auteur
Gobikrishnan Subramaniam
  • Fonction : Auteur
Abraham Moller
  • Fonction : Auteur
Rachael Oluwakamiye Abolade
  • Fonction : Auteur
Arth Banka
  • Fonction : Auteur
Samuel Blechman
  • Fonction : Auteur
Rorry Brenner
  • Fonction : Auteur
Maria Chikina
  • Fonction : Auteur
Li Chuin Chong
  • Fonction : Auteur
Nicholas Cooley
  • Fonction : Auteur
Daniel Chang
  • Fonction : Auteur
Phil Greer
  • Fonction : Auteur
Anshika Gupta
  • Fonction : Auteur
Avish Jha
  • Fonction : Auteur
Emrah Kacar
  • Fonction : Auteur
Nanami Kubota
  • Fonction : Auteur
William Lu
  • Fonction : Auteur
Louison Luo
  • Fonction : Auteur
Tien Ly
  • Fonction : Auteur
Rajarshi Mondal
  • Fonction : Auteur
Ciara O’donoghue
  • Fonction : Auteur
Aung Myat Phyo
  • Fonction : Auteur
Peng Qiu
  • Fonction : Auteur
Glenn Ross-Dolan
  • Fonction : Auteur
Ali Saadat
  • Fonction : Auteur
Shivank Sadasivan
  • Fonction : Auteur
Rebecca Satterwhite
  • Fonction : Auteur
Soham Shirolkar
  • Fonction : Auteur
Yuning Zheng
  • Fonction : Auteur
Huajin Wang
Melanie Gainey
  • Fonction : Auteur
Ben Busby

Résumé

In March 2025, 34 scientists from the United States, Ireland, the United Kingdom, Switzerland,France, Germany, Spain, India, and Australia gathered in Pittsburgh, Pennsylvania and virtuallyfor a collaborative biohackathon, hosted by DNAnexus and Carnegie Mellon University Libraries.The goal of the hackathon was to explore machine learning approaches for multimodalproblems in computational biology using public datasets. Teams worked on the followinginnovative projects: applying machine learning techniques for clustering and similarity analysisof haplotypes; adapting the StructLMM framework to study Gene-Gene (GxG) interactions;creating a nextflow workflow for generating an imputation reference panel using large-scalecohort data; optimizing discovery of causal relationships in large electronic health record (EHR)datasets using the open source causal analysis software Tetrad; examining the evolution of agraph neural network in a Lenski-esque experiment; and developing tools and workflows forgenerating pathway intersection diagrams and graph-based analyses for multiomics data. Allprojects were dedicated to study the background genomic and environmental effects underlyingcomplex genotype-phenotype relationships. Their objective was to set foundations for furtherstudies on predicting complex phenotypic traits using integrative multi-omic and environmentalanalyses.

Fichier principal
Vignette du fichier
paper_final.pdf"; filename*=UTF-8''paper_final.pdf (7.94 Mo) Télécharger le fichier
Origine Fichiers produits par l'(les) auteur(s)
Licence

Dates et versions

hal-05274100 , version 1 (23-09-2025)

Licence

Identifiants

Citer

Siddharth Sabata, Jędrzej Kubica, Rishika Gupta, Lars Warren Ericson, Halimat Chisom Atanda, et al.. Addressing Background Genomic and Environmental Effects on Health through Accelerated Computing and Machine Learning: Results from the 2025 Hackathon at Carnegie Mellon University. 2025. ⟨hal-05274100⟩
98 Consultations
94 Téléchargements

Altmetric

Partager

  • More