h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Virtual patient modeling for heterogeneous intensive care unit data for the support of artificial intelligence = Modellierung virtueller Patienten für heterogene Intensivstationsdaten zur Unterstützung der künstlichen Intelligenz



Verantwortlichkeitsangabevorgelegt von Konstantin Sharafutdinov

ImpressumAachen : RWTH Aachen University 2023

Umfang1 Online-Ressource : Illustrationen, Diagramme


Dissertation, Rheinisch-Westfälische Technische Hochschule Aachen, 2023

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University


Genehmigende Fakultät
Fak04

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2023-05-03

Online
DOI: 10.18154/RWTH-2023-05200
URL: https://publications.rwth-aachen.de/record/958236/files/958236.pdf

Einrichtungen

  1. Institut und Lehrstuhl für Computational Biomedicine (530000-4 ; 925310)
  2. Lehrstuhl für Systemverfahrenstechnik (416710)

Inhaltliche Beschreibung (Schlagwörter)
ARDS (frei) ; ICU (frei) ; artificial intelligence (frei) ; computational modeling (frei) ; digital twin (frei) ; machine learning (frei) ; virtual patient (frei)

Thematische Einordnung (Klassifikation)
DDC: 620

Kurzfassung
Die Technologien der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) haben ihre Leistungsfähigkeit bereits in vielen Bereichen des Gesundheitswesens bewiesen. Dies gilt auch für die Intensivstation (ICU). Die begrenzte Generalisierung von ML-Modellen, die auf den Datensätzen eines einzigen Zentrums entwickelt wurden stellt jedoch ein erhebliches Hindernis für die breite Anwendung der ML-Ansätze in der klinischen Praxis dar. Die Datenstrukturen und Patientenkohorten unterscheiden sich erheblich von Krankenhaus zu Krankenhaus, was zu einem zusätzlichen Bias aufgrund der Herkunft der Daten führt. In unserer Studie schlagen wir zwei Frameworks vor, um die Herausforderung der schlechten Generalisierung von ML-Modellen im Gesundheitswesen anzugehen. Das erste Framework ermöglicht die quantitative Bewertung der Verzerrung von Datensätzen. Es ermöglicht eine a priori Bewertung der Generalisierbarkeit von ML-Modellen in einem neuen Datensatz auf der Grundlage der CH-Überschneidungen zwischen einem für das Modelltraining verwendeten Datensatz und dem neuen Datensatz. Erstens wird die CH-Analyse angewandt, um die mittlere CH-Abdeckung zwischen den beiden Datensätzen zu ermitteln, die auf den Überschneidungen der CH-Projektionen auf Unterräume basiert, die von allen Kombinationen von 2 Merkmalen aufgespannt werden. Zweitens werden 4 Arten von ML-Modellen trainiert zu beurteilen, ob es möglich ist, zwischen Patienten aus verschiedenen Krankenhäusern zu unterscheiden. Die Leistung der ML-Modelle wird bewertet, um festzustellen, ob sich die Datenverteilungen in den Krankenhäusern unterscheiden. Durch die Kombination der Ergebnisse dieser beiden Schritte erhält man einen vollständigen Überblick über potenzielle Generalisierungsprobleme. Der zweite Beitrag unserer Arbeit ist die Entwicklung eines Frameworks für die Modellierung virtueller Patienten (VP) für reale ICU-Daten. VP-Modelle sind rechnergestützte Modelle, die pathophysiologische Zustände modellieren. Nach der Anpassung an reale Patientendaten stellt ein VP-Modell einen bestimmten pathophysiologischen Zustand eines realen Patienten dar. Unser VP Modeling Framework nutzt ein Modell des kardiopulmonalen Systems, um relevante medizinische Informationen über einzelne Patienten anhand der modellgefilterten Daten zu extrahieren, die reale physiologische Prozesse widerspiegeln. Die Ergebnisse des VP Modeling Frameworks werden als Inputs für unüberwachte ML-Methoden verwendet, die zur Charakterisierung von Patientenkohorten auf der Grundlage ihrer mechanistischen Parametrisierung verwendet werden. Wir zeigen die Vorteile solches hybriden Modellierungs-Frameworks im Vergleich zur direkten Verwendung der ICU-Daten in ML-Algorithmen. So können modellgefilterte Daten genutzt werden, um das Bias aufgrund der Herkunft der Daten zu reduzieren und medizinisch relevante Subpopulationen zu entdecken. Alles in allem ermöglichen unsere hybriden Frameworks einen Schritt in Richtung der Nutzung von realen ICU-Daten aus heterogenen Quellen, was zahlreiche Vorteile für das Gesundheitswesen mit sich bringt.

Artificial intelligence (AI) and machine learning (ML) technologies have already shown their power and applicability in multiple areas of healthcare, including the intensive care unit (ICU). However, the limited generalizability of ML models developed on single-center datasets, and subsequently the impaired performance of such models in real-world settings, constitutes a significant constraint to the widespread adoption of data-based approaches in clinical practice. Furthermore, data structures and patient cohorts may significantly differ between hospitals introducing additional bias driven by data origin. These differences can be characterized as a dataset bias which is characteristic for data acquired in the ICU and represents a major challenge for the application of ML methods in the ICU setting. In our study we propose two frameworks to address the challenge of poor generalization of ML models. The first framework enables the quantitative assessment of dataset bias based on convex hull (CH) analysis and ML methods. It allows an a priori assessment of the generalizability of ML models in a new dataset based on the CH overlaps between a dataset used for model training and the new dataset. First, CH analysis is applied to find mean CH coverage between the two datasets based on overlaps of CH projections onto subspaces spanned by all combinations of 2 features providing an upper bound for the generalization ability of a ML model. Second, 4 types of ML models are trained to classify the origin of a dataset to assess whether it is possible to distinguish between patients from different hospitals. The performance of ML models is evaluated to determine whether hospital's datasets differ in terms of underlying data distributions. Combining the results of these 2 steps, a complete vision of potential generalization issues is obtained. The second contribution of our work is the development of a virtual patient (VP) modeling framework utilizing real-world ICU data pooled from different hospitals. VP models are computational models which simulate pathophysiological states. After being matched to real patient data, they allow to extract the core information describing a patient's status. Our VP modeling framework employs a mechanistic VP model of the cardiopulmonary system for data augmentation through identification of individualized model parameters approximating disease states of ICU patients. Parameters derived in the VP modeling framework are utilized as inputs for unsupervised ML methods which are used to characterize patient cohorts based on their mechanistic parametrization. Thus, a hybrid modeling framework for the analysis of large-scale ICU patient data is created. We show the advantages of this hybrid modeling framework in comparison to the direct utilization of original ICU data in ML algorithms. Thus, model-derived data can be utilized to reduce dataset bias and discover medically relevant patient subpopulations in heterogeneous ICU datasets. All in all, our novel frameworks integrating both mechanistic and data-driven models allow making a step towards utilization of available real-world ICU data from heterogeneous sources, which encompasses numerous benefits for healthcare.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis

Format
online

Sprache
English

Externe Identnummern
HBZ: HT030021933

Interne Identnummern
RWTH-2023-05200
Datensatz-ID: 958236

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mechanical Engineering (Fac.4)
Publication server / Open Access
Faculty of Medicine (Fac.10)
Public records
530000\-4
Publications database
416710

 Record created 2023-05-12, last modified 2025-08-21


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)