Analyse von Ganzgenomsequenzierungsdaten
Die im Rahme des CADS- Projekts generierten Genomdaten werden mit Hilfe der bestehenden CUBI-Infrastruktur serviceoriented verarbeitet. Unsere eigenen Methoden zur Variantenvorhersage werden so modifiziert, dass sie für Kliniker*innen leichter zugänglich sind. Darüber hinaus werden wir den Nutzern Unterstützung für VarFish und die Dateninterpretation anbieten. Dies umfasst individuelle projektspezifische Bioinformatikdienste für die CADS-Projekte, einschließlich der Analyse der Mutationslast und der Integration von Long-Read-Sequenzierungs- oder Hi-C-Daten. Wir werden neue und verbesserte Analysemethoden integrieren, um Genomanalysen auf dem neuesten Stand der Technik anzubieten. Dazu gehören neue Methoden zum Auffinden von Strukturvarianten und Kopienzahlvariationen sowie Methoden zur Erkennung von Repeat-Expansionen in Short-Read-Daten und Verlust von Heterozygotie. Wir werden jeden Ansatz in die Pipeline integrieren, sie validieren und dokumentieren und die CADS-Nutzer schulen. Unsere hauseigene Variantenanalyseplattform VarFish (Holtgrewe, M. et al., 2020) konzentriert sich derzeit auf kleine Varianten (Einzelnukleotidvarianten und kleine Insertionen/Deletionen). Die Unterstützung für strukturelle Varianten (z. B. ab einer Größe von 10 Nukleotiden) ist nur in Ansätzen implementiert und soll stark verbessert werden.