AG Kehr – Genominformatik

Dr. Birte Kehr arbeitet seit November 2016 am BIH, wo sie die Nachwuchs-Forschungsgruppe Genominformatik aufgebaut hat. Gemeinsam mit ihrem Team entwickelt sie neuartige, computerbasierte Lösungen zur Analyse von Gensequenzdaten.

Variationen innerhalb des Genoms haben einen Einfluss darauf, wie anfällig wir für bestimmte Krankheiten sind und wie unser Körper auf Behandlungen reagiert. Um die spezifischen genetischen Voraussetzung von Patienten zu interpretieren, benötigen wir umfassende Referenzsätze genetischer Variationen. Die Nachwuchs-Forschungsgruppe Genominformatik will solche Referenzsätze mit Hilfe von Gensequenzdaten verbessern. Zu diesem Zweck entwickelt sie Verfahren, mit denen sich insbesondere strukturelle Variationen erkennen lassen, also große Sequenzabweichungen, die mindestens 50 Basenpaare des Genoms betreffen. Das Spektrum struktureller Variationen reicht von Einfügungen (Insertionen), Auslassungen (Deletionen) und Duplikationen (CNV / Kopienzahlvarianten) bis hin zu Inversionen, Translokationen und noch komplexeren Abweichungen. Strukturelle Variationen können Genstruktur, Genexpression und genomische Architektur verändern.

Schwierig zu erkennen sind strukturelle Variationen unter anderem dadurch, dass sie sich über lange Abschnitte der DNA erstrecken, etablierte Technologien zur Sequenzierung jedoch nur kurze Abschnitte von meist 150 Basenpaaren auslesen. Doch auch diese Short-Read-Daten enthalten Hinweise auf strukturelle Variationen, die durch computerbasierte Ansätze entschlüsselt werden können. Ein Ansatz der Nachwuchs-Forschungsgruppe Genominformatik besteht darin, Daten mehrerer Genome gemeinsam zu analysieren und so die Daten eines einzelnen Genoms nicht nur mit dem menschlichen Referenz-Genom, sondern auch mit vielen anderen menschlichen Genomen zu vergleichen.

Darüber hinaus untersucht die Forschungsgruppe Daten aus modernsten Sequenzierungsverfahren, darunter Linked-read- und Long-read-Verfahren. Bei der Linked-read-Sequenzierung werden Informationen zu längeren Sequenzabschnitten durch sogenannte Barcodes in Short-read-Daten integriert. Long-read-Technologien dagegen erstellen Sequenzen mit einer Länge von mehreren Tausend Basenpaaren, jedoch mit einer sehr hohen Fehlerquote. Beide Technologien – Barcodes und lange Sequenzen mit hohen Fehlerquoten – fügen der Datenanalyse zusätzliche Komplexitätsebenen hinzu. Diesen Komplexitätsebenen begegnet die Nachwuchs-Forschungsgruppe Genominformatik mit neuen computerbasierten Ansätzen.

Durch die Zusammenarbeit mit Partnern aus den Bereichen Biologie und Medizin leistet die Nachwuchs-Forschungsgruppe Genominformatik einen Beitrag zur Erforschung verschiedener Krankheiten. Dr. Birte Kehr hat bereits in der Vergangenheit Varianten beschrieben, die mit unterschiedlichen Krebsarten sowie Nieren- und Herzerkrankungen in Zusammenhang stehen. Laufende Kooperationsprojekte am BIH und an der Charité vertiefen die Untersuchung von Genvariationen bei Krebs- und seltenen Erkrankungen. Durch die Verbindung aus biomedizinischer Forschung und computergestützten Forschungsansätzen möchte die Nachwuchs-Forschungsgruppe Genominformatik zum Wissen um genetische Variationen beitragen und sein Potenzial für die Präzisionsmedizin erschließen.

Forschungsschwerpunkt

  • Gemeinsame Analyse vieler Proben (Joint Calling) auf strukturelle Variationen
  • Analyse von struktureller Variation in Daten aus der Long-read-Sequenzierung
  • Analyseverfahren für Linked-read-Sequenzierungsdaten

Team

Birte Kehr, Gruppenleiterin
Tim White, Postdoc, tim.white@bihealth.de
Sebastian Roskosch, Doktorand, sebastian.roskosch@bihealth.de
Thomas Krannich, Doktorand, thomas.krannich@bihealth.de

Vor Ihrer Tätigkeit am BIH war Dr. Birte Kehr wissenschaftliche Mitarbeiterin bei deCODE genetics in Island, wo sie Erfahrungen mit großangelegten Analysen von genetischen Daten machte. Dort entwickelte sie auch ein besonderes Interesse daran strukturelle Variationen aufzudecken, was zum tieferen Verständnis menschlicher Erkrankungen beitragen kann. Dr. Kehr promovierte 2014 an der International Max Planck Research School for Computational Biology and Scientific Computing (IMPRS-CBSC), dem gemeinsames Graduiertenprogramm der Freien Universität Berlin (FU) und des Max-Planck-Instituts für molekulare Genetik (MPIMG). In ihrer Doktorarbeit beschäftigte sie sich mit Algorithmen und Datenstrukturen für das multiple Sequenzalignment ganzer Genome.

Ausgewählte Publikationen

Jónsson H, Sulem P, Kehr B, Kristmundsdottir S, Zink F, Hjartarson E, Hardarson MT, Hjorleifsson KE, Eggertsson HP, Gudjonsson SA, Ward LD, Arnadottir GA, Helgason EA, Helgason H, Gylfason A, Jonasdottir Ad, Jonasdottir As, Rafnar Th, Frigge M, Stacey SN, Magnusson OTh, Thorsteinsdottir U, Masson G, Kong A, Halldorsson BV, Helgason A, Gudbjartsson DF, Stefansson K (2017). Parental influence on human germline de novo mutations in 1,548 trios from Iceland. Nature, 549:519–522.

Kehr B, Helgadottir A, Melsted P, Jonsson H, Helgason H, Jonasdottir Ad, Jonasdottir As, Sigurdsson A, Gylfason A, Halldorsson GH, Kristmundsdottir S, Thorgeirsson G, Olafsson I, Holm H, Thorsteinsdottir U, Sulem P, Helgason A, Gudbjartsson DF, Halldorsson BV, Stefansson K (2017). Diversity in non-repetitive human sequences not found in the reference genome. Nat Genet, 49(4):588-593.

Eggertsson HP, Jonsson H, Kristmundsdottir S, Hjartason E, Kehr B, Masson G, Zink F, Hjorleifsson KE, Jonasdottir As, Jonasdottir Ad, Jonsdottir I, Gudbjartsson DF, Melsted P, Stefansson K, Halldorsson BV (2017). Graphtyper enables population-scale genotyping using pangenome graphs. Nat Genet, 49(11):1654-1660.

Kehr B, Melsted P, Halldorsson BV (2016). PopIns: population-scale detection of novel sequence insertions. Bioinformatics, 32(7):961-967.