h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

A computational framework for the genotyping of single cell RNA sequencing data



Verantwortlichkeitsangabevorgelegt von Martin Graßhoff, M. Sc.

ImpressumAachen : RWTH Aachen University 2025

Umfang1 Online-Ressource : Illustrationen


Dissertation, RWTH Aachen University, 2025

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University 2026


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2025-12-05

Online
DOI: 10.18154/RWTH-2026-00479
URL: https://publications.rwth-aachen.de/record/1025026/files/1025026.pdf

Einrichtungen

  1. Institut und Lehrstuhl für Computergestützte Genomik (530000-5 ; 925410)
  2. Institut und Lehr- und Forschungsgebiet Stammzellbiologie (811002-3 ; 924120)
  3. Fachgruppe Biologie (160000)

Thematische Einordnung (Klassifikation)
DDC: 570

Kurzfassung
Die Entwicklung von Einzelzell-RNA-Sequenzierungtechnologien (scRNA-seq) ermöglicht die Untersuchung einer großen Anzahl einzelner Zellen. Die Untersuchung von Unterschieden zwischen verschiedenen Zuständen, wie beispielsweise erkrankten und gesunden Zellen, kann auf Einzelzellebene durchgeführt werden, was zu einer genaueren Einschätzung der zellspezifischen Veränderungen bei einer Erkrankung führt. Durch die Berücksichtigung von Varianten innerhalb der gemessenen Transkripte ist es auch möglich, somatische Varianten zu bewerten und klonale Zelllinien zu charakterisieren. Dies ist insbesondere bei Krebserkrankungen wünschenswert, da Mutationen ein wichtiger Treiber für die Entstehung von Krebs sind. Dies gilt insbesondere für Krebserkrankungen wie myeloproliferative Neoplasien (MPN), da MPN typischerweise mit sich gegenseitig ausschließenden Treibermutationen und zusätzlichen sekundären Mutationen assoziiert sind. Die Sparsität der scRNA-seq-Daten (sehr wenige Reads pro Transkript) oder eine Verzerrung in den Protokollen (Begünstigung der 3’-Enden der Transkripte) machen es jedoch sehr unwahrscheinlich, dass somatische Varianten erfasst werden können. Diese Herausforderungen können durch lokusspezifische Sequenzierung bekannter Treibermutationen und die Verwendung mitochondrialer Varianten als natürliche Barcodes zur Identifizierung klonaler Linien überwunden werden. Derzeit verfügbare Computertools konzentrieren sich auf die Genotypisierung, bieten jedoch keine Funktionen für die kombinierte Analyse somatischer und mitochondrialer Varianten und für Funktionsanalysen wie die Charakterisierung von Genexpressionsänderungen in detektierten Klonen. Daher schlagen wir SIGURD vor, eine R-basierte Pipeline für die klonale Analyse von scRNA-seq-Daten. Unser Ansatz ermöglicht die Identifizierung von Klonen durch die Nutzung sowohl somatischer als auch mitochondrialer Varianten. SIGURD ermöglicht auch eine Funktionsanalyse nach der Klonerkennung: Assoziation von Klonen mit Zellpopulationen, Erkennung von unterschiedlich exprimierten Genen über Klone hinweg und Assoziation von somatischen und mitochondrialen Varianten. Hier demonstrieren wir die Leistungsfähigkeit von SIGURD durch die Analyse von Einzelzelldatenaus zwei Fallstudien, beide von Patienten mit MPN. In der ersten Fallstudie analysieren wir koloniebildende Einheiten (CFU) von Patienten mit MPN und gesunden Personen. Wir genotypisieren Zellen für die JAK2V617F-Treibermutation und für mitochondriale Varianten (mtVar). Dies ermöglicht es uns, den Einfluss der Treibermutation auf die Zellen zu bestimmen und die klonale Diversität in MPN- und gesunden Proben mithilfe mitochondrialer Varianten zu quantifizieren. In der zweiten Fallstudie analysieren wir einen Myelofibrose-Zellatlas. In dieser Studie wurden Patienten vor und nach einer allogenen Knochenmarktransplantation genotypisiert. Dies gibt uns die Möglichkeit, das Vorhandensein mutierter Zellen im Zeitverlauf zu verfolgen und das Vorhandensein behandlungsresistenter klonaler Linien zu bestimmen. Unsere Ergebnisse zeigen die Nützlichkeit der Einzelzell-Genotypisierung für die Analyse klonaler Erkrankungen und die Leistungsfähigkeit von SIGURD, dies zu erleichtern.

he development of single-cell RNA-sequencing (scRNA-seq) technologies allows the investigation of individual cells in large numbers. Investigating differences between conditions, such as disease and healthy cells, can be conducted at the single cell level, leading to a more accurate estimation of cell specific changes in a disease. By accounting for variants within measured transcripts, it is also possible to evaluate somatic variants and characterize clonal cell lineages. This is especially desirable in the case of cancers, as mutations are a major driver for the development of cancers. Especially in the case of cancers like myeloproliferative neoplasms (MPN), as MPNs are typically associated with mutually exclusive driver mutations and additional secondary mutations. However, the sparsity of the scRNA-seq data (very few reads per transcript) or a bias in protocols(favoring 3’ ends of the transcripts) makes the chance of capturing somatic variants very unlikely. These challenges can be overcome by locus-specific sequencing for known driver mutations and the use of mitochondrial variants as natural barcodes to identify clonal lineages. Currently, available computational tools focus on genotyping, but do not provide functionality for combined analysis of somatic and mitochondrial variants and functional analysis such as characterization of gene expression changes in detected clones. Therefore, we propose SIGURD, which is an R-based pipeline for the clonal analysis of scRNA-seqdata. Our approach allows to identify clones by leveraging both somatic and mitochondrial variants. SIGURD also allows for functional analysis after clonal detection: association of clones with cell populations, detection of differentially expressed genes across clones and association of somatic and mitochondrial variants. Here, we demonstrate the power of SIGURD by analyzing single-cell data from two case studies, both of patients with MPN. In the first case study, we analyze colony-forming units (CFU) derived from patients with MPN and healthy individuals. We genotype cells for the JAK2V617F driver mutation and for mitochondrial variants (mtVar). This allow us to determine the influence of the driver mutation on the cells and to quantify the clonal diversity in MPN and healthy samples by the use of mitochondrial variants. In the second case study, we analyze a myelofibrosis cell atlas. In this study, patients were genotyped before and after receiving an allogeneic bone marrow transplant. This provides us with the opportunity to track the presence of mutated cells over time and determine the presence of treatment-resistant clonal lineages. Our results demonstrate the usefulness of single cell genotyping for the analysis of clonal diseases and the power of SIGURD to facilitate this.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis

Format
online

Sprache
English

Externe Identnummern
HBZ: HT031375017

Interne Identnummern
RWTH-2026-00479
Datensatz-ID: 1025026

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics and Natural Sciences (Fac.1) > Department of Biology
Publication server / Open Access
Faculty of Medicine (Fac.10)
Public records
530000\-5
811002\-3
Publications database
160000

 Record created 2026-01-13, last modified 2026-02-19


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)