Masterpraktikum SS2024

Development of a platform for the exploration of the CHRIS data via multi-level network medicine

Allgemeine Informationen

Credits (SWS) 12 (10 SWS)
Modulniveau Master
Sprache Deutsch/English
Gesamtstunden 360 h
Wöchentlicher Zeitslot 2-3 days/week
Blockteil in vorlesungsfreier Zeit noch nicht festgelegt

Zeitablauf des Praktikums

Feb - Mar 2024 Kickoff Meeting und Zuordnung der Projekte und Teams
Apr - Jul 2024 Aufteilung der Projektarbeit, Zwischenpräsentationen
Jul - Aug 2024 Blockteil für den Abschluss der Projektarbeit, das Verfassen des Berichts und die Vorbereitung der Abschlusspräsentation

Vorraussetzungen und Vorkenntnisse

Bachelor Bioinformatik, insbesondere erfolgreicher Abschluss des GoBi-Moduls. Gute Python Programmierkenntnisse. Interesse an Datenvisualisierung und Netzwerk Medizin. Vorkenntnisse in der Entwicklung von Softwares sind von Vorteil, aber kein Muss.

Beschreibung

Bevölkerungsbasierte epidemiologische Kohorten wie die Cooperative Health Research in Südtirol (CHRIS)-Studie [1] bieten einen umfassenden Überblick über den Gesundheitszustand der allgemeinen Bevölkerung und erfassen effektiv den Standardbereich der Physiologie sowie ein Spektrum pathologischer Zustände, im Gegensatz zu krankheitsfokussierten Studien. Insbesondere ermöglicht die Integration von molekularem Profiling (Genomik und Metabolomik) mit klinischen und Lebensstildaten die Identifizierung von physiologischen Veränderungen, die zu Komplikationen führen oder die Prävalenz bzw. Frühzeichen von Krankheiten anzeigen könnten.

Im Gegensatz zu hypothesengetriebenen, krankheitsfokussierten Studien bieten bevölkerungsbasierte Kohorten Vielseitigkeit in der Hypothesenprüfung und -erstellung, basierend auf statistisch signifikanten Datenassoziationen. Netzwerkbasierte Ansätze eignen sich besonders für diesen Zweck, und mit Werkzeugen zur Multi-Omics-Integration [2] und graphbasierten maschinellen Lernverfahren zur Identifizierung von Krankheitsassoziationen [3] kann diese Art der explorativen Analyse für biomedizinische Forscher zugänglich gemacht werden, die nicht unbedingt Erfahrung mit Datenanalyse oder maschinellem Lernen haben.

Als Reaktion auf diese Fortschritte und die Verfügbarkeit der CHRIS-Studie entwickeln wir derzeit eine Plattform für die dynamische Erkundung epidemiologischer Bevölkerungskohorten mittels Multi-Level-Netzwerkmedizin. Komplexe Assoziationsscores zwischen genetischen Varianten, Metaboliten und zusätzlichen Meta-Informationen werden berechnet und ein Multi-Omics-Netzwerk wird konstruiert, um klinisch signifikante Untergruppen zu identifizieren und die Unterschiede zwischen Gruppen auf Basis verschiedener Bedingungen, die typischerweise in einer gesunden Kohorte gefunden werden, zu skizzieren.

Während dieses Praktikums ist es unser Ziel, eine erste Version der DyHealthNet-Plattform zu entwickeln. Der erste Schritt beinhaltet den Aufbau eines statischen Multi-Omics-Netzwerks unter Verwendung simulierter Daten, bei denen komplexe Assoziationsscores zwischen verschiedenen Knotentypen berechnet werden. Um die in CHRIS verfügbaren Daten zu ergänzen, ist die Integration von Daten aus externen öffentlichen Quellen geplant, wie OMIM [4] für die Interpretation genetischer Varianten und STRING [5] für die Kartierung von Gen-Gen-Interaktionen. Dieses statische Multi-Omics-Netzwerk wird für explorative Analysen über eine grafische Schnittstelle zugänglich gemacht, wobei Django für die Backend-Entwicklung und ein JavaScript-Framework wie AngularJS für das Frontend verwendet wird. Die Plattform ermöglicht es den Nutzern, das Multi-Omics-Netzwerk über mehrere Datentypen hinweg zu durchsuchen und relevante Assoziationen über Filter- und Netzwerkanalysemethoden, wie die Analyse der Knotenzentralität, zu entdecken.

Literatur

  1. Pattaro, C., Gögele, M., Mascalzoni, D., Melotti, R., Schwienbacher, C., De Grandi, A., Foco, L., D’Elia, Y., Linder, B., Fuchsberger, C., Minelli, C., Egger, C., Kofink, L. S., Zanigni, S., Schäfer, T., Facheris, M. F., Smárason, S. V., Rossini, A., Hicks, A. A., … Pramstaller, P. P. (2015). The Cooperative Health Research in South Tyrol (Chris) study: Rationale, objectives, and preliminary results. Journal of Translational Medicine, 13, 348. https://doi.org/10.1186/s12967-015-0704-9
  2. Hawe, J. S., Theis, F. J., & Heinig, M. (2019). Inferring interaction networks from multi-omics data. Frontiers in Genetics, 10. https://www.frontiersin.org/articles/10.3389/fgene.2019.00535
  3. Wang, T., Shao, W., Huang, Z., Tang, H., Zhang, J., Ding, Z., & Huang, K. (2021). MOGONET integrates multi-omics data using graph convolutional networks allowing patient classification and biomarker identification. Nature Communications, 12(1), 3445. https://doi.org/10.1038/s41467-021-23774-w
  4. Amberger, J. S., Bocchini, C. A., Scott, A. F., & Hamosh, A. (2019). OMIM.org: Leveraging knowledge across phenotype-gene relationships. Nucleic Acids Research, 47(D1), D1038–D1043. https://doi.org/10.1093/nar/gky1151
  5. Szklarczyk, D., Gable, A. L., Lyon, D., Junge, A., Wyder, S., Huerta-Cepas, J., Simonovic, M., Doncheva, N. T., Morris, J. H., Bork, P., Jensen, L. J., & Mering, C. von. (2019). STRING v11: Protein-protein association networks with increased coverage, supporting functional discovery in genome-wide experimental datasets. Nucleic Acids Research, 47(D1), D607–D613. doi.org/10.1093/nar/gky1131