2026
Masterarbeit, RWTH Aachen University, 2025
Veröffentlicht auf dem Publikationsserver der RWTH Aachen University
Genehmigende Fakultät
Fak09
Hauptberichter/Gutachter
; ; ;
Tag der mündlichen Prüfung/Habilitation
2025-12-23
Online
DOI: 10.18154/RWTH-2025-10668
URL: https://publications.rwth-aachen.de/record/1023684/files/1023684.pdf
Einrichtungen
Inhaltliche Beschreibung (Schlagwörter)
CFD-ML coupling (frei) ; computational fluid dynamics (frei) ; hybrid inference (frei) ; machine learning (frei) ; model evaluation (frei) ; turbulent boundary layer simulation (frei)
Thematische Einordnung (Klassifikation)
DDC: 004
Kurzfassung
Gegenwärtige Bemühungen zur Reduzierung von Treibhausgasemissionen im Luftfahrtsektor umfassen die Erforschung von Methoden zur aktiven Verringerung des Luftwiderstands (ADR). Die Bewertung von ADR Methoden erfordert jedoch rechenintensive Computational Fluid Dynamics (CFD)-Simulationen der widerstandserzeugenden turbulenten Grenzschicht (TBL). Diese hohen Rechenkosten habenjüngste Versuche motiviert, die Simulationen durch maschinelles Lernen (ML) zu beschleunigen. In vorangegangenen Arbeiten wurde ein Transformer-Modell für diese Aufgabe vorgestellt, eine prototypische Kopplung mit dem Multiphysik-Solver m-AIA vorgeschlagen und eine modulare Fortran-basierte Schnittstelle entwickelt. In dieser Arbeit implementieren wir eine vollständige Kopplung zwischen m-AIA und dem Transformer, indem wir die Fortran-basierte Schnittstelle in C++ neu entwickeln. Dadurch ermöglichen wir eine flexible Verbindung von modernen CFD Solvern mit ML Modellen, die je nach Bedarf mit den Kopplungsbibliotheken PhyDLL oder AIxeleratorService genutzt werden kann. Mit beiden Bibliotheken erreichen wir eine nicht stagnierende Skalierbarkeit und hohe parallele Effizienz, wobei der AIxeleratorService die niedrigsten absoluten Laufzeiten liefert. Um die Effizienz auf modernen heterogenen Clustern zu maximieren, erweitern wir den AIxeleratorService um die Inferenzarbeit auf die verfügbaren CPU- und GPU-Ressourcen zu verteilen. Wir entwickeln ein formales Modell zur Bestimmung der optimalen Arbeitsverteilung und validieren unseren Ansatz experimentell, wobei wir nahezu optimale Ergebnisse erzielen, mit Leistungs- und Energieffizienz gewinnen die mit der Anzahl der pro GPU zugewiesenen CPU skalieren. Außerdem führen wir eine ganzheitliche Bewertung des Transformers für seine vorgesehene Aufgabe durch. Wir stellen fest, dass geringe konventionelle Fehler erhebliche physikalische Ungenauigkeiten verdecken, die sich negativ auf die Lösung des gekoppelten Solvers auswirken. Unsere Architekturanalyse zeigt grundlegende Einschränkungen auf und schlägt Verbesserungen sowie alternative Modelle vor. Um zukünftige Entwicklungen zu beschleunigen, implementieren wir eine modulare Trainingspipeline und demonstrieren deren Leistungsfähigkeit durch das Training eines Prototypmodells.Ongoing efforts to reduce greenhouse gas emissions in the aviation sector include research on Active Drag Reduction (ADR) methods. However, evaluating ADR methods requires computationally expensive Computational Fluid Dynamics (CFD) simulations of the drag-inducing Turbulent Boundary Layer (TBL). This high cost has motivated recent efforts to accelerate the simulations using Machine Learning (ML). Prior works introduced a Transformer model for this task, proposed a prototype coupling to the multi-physics solver m-AIA and developed a modular Fortran-based connecting interface. In this thesis, we implement a complete coupling between m-AIA and the Transformer by redeveloping the Fortran-based interface in C++, thereby enabling a flexible connection of modern CFD solvers with ML models interchangeably through either the PhyDLL or AIxeleratorService coupling libraries. With both libraries we achieve non-stagnating scalability and high parallel efficiency, while the AIxeleratorService yields the lowest absolute runtimes. To maximize efficiency on modern heterogenous clusters, we extend the AIxeleratorService to distribute inference workloads across available CPU and GPU resources. We derive a formal model to determine the optimal work distribution and validate our approach experimentally, yielding near optimal results, with performance and energy efficiency gains that scale with the number of allocated CPUs to GPUs. We also conduct a holistic assessment of the Transformer for its intended task. We find that low conventional errors mask substantial physical inaccuracies, which negatively affect the coupled solver solution. Our architectural analysis identifies fundamental limitations and proposes improvements as well as alternative models. To accelerate future development, we implement a modular training pipeline and successfully demonstrate its capabilities by training a prototype model.
OpenAccess:
PDF
(additional files)
Dokumenttyp
Master Thesis
Format
online
Sprache
English
Interne Identnummern
RWTH-2025-10668
Datensatz-ID: 1023684
Beteiligte Länder
Germany
|
The record appears in these collections: |