h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Generating calorimeter showers as point clouds



Verantwortlichkeitsangabevorgelegt von Simon Patrik Schnake, M.Sc.

ImpressumAachen : RWTH Aachen University 2025

Umfang1 Online-Ressource : Illustrationen


Dissertation, RWTH Aachen University, 2025

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2025-01-31

Online
DOI: 10.18154/RWTH-2025-06385
DOI: 10.3204/PUBDB-2025-01839

URL: https://publications.rwth-aachen.de/record/1015426/files/1015426.pdf

Einrichtungen

  1. Lehrstuhl für Experimentelle Elementarteilchenphysik (DESY) (131910)
  2. Fachgruppe Physik (130000)

Thematische Einordnung (Klassifikation)
DDC: 530

Kurzfassung
Die Simulation von Teilchenwechselwirkungen in Hochenergiephysik-Detektoren ist entscheidend, um experimentelle Daten zu interpretieren und das Verständnis der fundamentalen Physik voranzutreiben. Kalorimeter messen die Energie von Teilchen durch Kaskaden, die als Showers bekannt sind, jedoch stellen ihre komplexen Reaktionen und die rechnerische Intensität traditioneller Simulationswerkzeuge wie Geant4 erhebliche Herausforderungen dar. Diese Herausforderungen werden bei hochgranularen Kalorimetern, die aus Millionen von Zellen bestehen, aber nur in einem spärlichen Teil Energieeinträge registrieren, noch verstärkt, was Vollsimulationen zunehmend unpraktikabel macht. In dieser Arbeit wird die Notwendigkeit effizienter und genauer Kalorimetersimulationen durch die Entwicklung neuartiger generativer maschineller Lernmodelle adressiert, die die inhärente Sparsität und punktartige Natur von Kalorimeterdaten nutzen. Erste Ansätze mit voxelbasierten generativen adversarialen Netzwerken (GANs), die Daten in einer diskreten Gitterstruktur modellieren, stießen aufgrund von Datenlücken und hoher Dimensionalität auf Skalierungsprobleme. Durch den Wechsel zu einer Punktwolken-Darstellung konnte CaloPointFlow, das erste Modell, das generative Techniken für Punktwolken auf Kalorimetersimulationen anwendet, entwickelt werden. Dieser Ansatz reduziert die Datenkomplexität, indem Showers als Sammlungen von Punkten im Raum behandelt werden, anstatt als dicht besetzte Gitter. Obwohl CaloPointFlow einen bedeutenden Fortschritt darstellte, zeigten sich Einschränkungen wie unzureichender Informationsaustausch zwischen den Punkten und Herausforderungen bei der Modellierung diskreter Koordinatenpositionen. Um diese Probleme zu beheben, wurde mit CaloPointFlow II eine neuartige Normalizing-Flow Architektur namens DeepSetFlow eingeführt, die direkte Interaktionen zwischen Punkten ermöglicht und komplexe Abhängigkeiten in den Daten erfasst. Zusätzlich wurde eine neue Dequantisierungsstrategie namens CDF-Dequantisierung implementiert, um die Zuordnung zwischen diskreten Zellpositionen und kontinuierlichem Raum zu verbessern, sowie eine Strategie entwickelt, um das Problem mehrerer Energieeinträge pro Zelle zu lösen. Trotz dieser Verbesserungen hatten rein punktwolkenbasierte Modelle Schwierigkeiten, sicherzustellen, dass jede Kalorimeterzelle nur einen Treffer erhält. Zur Lösung dieses Problems wird in dieser Arbeit CaloHit vorgestellt, ein hybrider Ansatz, der voxelbasierte und punktwolkenbasierte Methoden kombiniert. Zunächst wird mit einer voxelbasierten Methode eine Hitmap zur Identifikation aktiver Zellen generiert und anschließend werden die Energien dieser Treffer mit einem punktwolkenbasierten Modell vorhergesagt. Dieser zweistufige Prozess behebt die Hauptbeschränkungen vorheriger Modelle, indem sichergestellt wird, dass alle Kalorimeterzellen ohne Wiederholung abgetastet werden und die Ein-Treffer-pro-Zelle-Bedingung eingehalten wird. Die Bewertung dieser Modelle zeigte ihr Potenzial, Kalorimeter-Showers genau zu reproduzieren und dabei den Rechenaufwand im Vergleich zu traditionellen Methoden erheblich zu reduzieren. Vorläufige Tests des CaloHit-Ansatzes zeigten vielversprechende Ergebnisse und deuten darauf hin, dass dieser Ansatz auf komplexere und höherdimensionale Datensätze skalierbar ist. Abschließend trägt diese Arbeit zur Weiterentwicklung der Surrogatmodellierung von Kalorimetern bei, indem innovative generative Modelle eingeführt und weiterentwickelt werden, die die Komplexität hochgranularer, spärlicher Daten effektiv bewältigen. Die vorgeschlagenen Methoden schaffen eine Grundlage für skalierbare, effiziente und experimentell validierte Simulationswerkzeuge. Zukünftige Arbeiten werden sich auf die weitere Verbesserung dieser Modelle, die Erkundung fortschrittlicherer Techniken wie Diffusionsmodelle oder bedingte Flow Matching-Verfahren und die Validierung ihrer Leistung in realen experimentellen Umgebungen konzentrieren. Die hier vorgestellten Entwicklungen bieten erhebliches Potenzial zur Steigerung der Effizienz und Genauigkeit von Simulationen in der Teilchenphysik und tragen letztlich zur Entdeckung neuer Erkenntnisse in diesem Bereich bei.

Simulating particle interactions within high-energy physics detectors is essential for interpreting experimental data and advancing our understanding of fundamental physics. Calorimeters measure particle energies through cascades known as showers, but their complex responses and the computational intensity of traditional simulation tools like Geant4 pose significant challenges. These are further compounded in high-granularity calorimeters, which consist of millions of cells yet register energy deposits in only a sparse subset, rendering full-scale simulations impractical. This thesis addresses the need for efficient and accurate calorimeter simulations by developing novel generative machine learning models that leverage the inherent sparsity and point like nature of calorimeter data. Initial efforts using voxel-based generative adversarial networks (GANs)—which model data in a discrete grid structure—encountered scaling issues due to data sparsity and high dimensionality. By shifting to a point cloud representation, the CaloPointFlow model was developed, marking the first application of point cloud generative techniques to calorimeter simulation. This approach reduces data complexity by treating showers as collections of points in space rather than densely populated grids. Although CaloPointFlow marked a significant advancement, limitations such as inadequate point-to-point information exchange and difficulties in modeling discrete coordinate positions were observed. To overcome these challenges, CaloPointFlow II introduced DeepSet-Flow, a novel normalizing flow architecture that enables direct interactions between points, capturing complex dependencies within the data. Additionally, a new dequantization strategy called CDF-Dequantization was implemented to better map discrete cell positions to continuous space, along with a mitigation strategy to handle multiple energy deposits per cell. Despite these improvements, purely point cloud-based models struggled to ensure one hit per calorimeter cell. To resolve this, CaloHit was introduced, a hybrid approach that combines voxel-based and point cloud methodologies. CaloHit first generates a hitmap to identify active cells using a voxel-based method and then predicts the energies of these hits with a point cloud-based model. This two-stage process effectively addresses the primary limitations of previous models by ensuring that all calorimeter cells are sampled without replacement and that the one-hit-per-cell constraint is maintained. Evaluations of these models demonstrated their potential to accurately reproduce calorimeter showers while significantly reducing computational resources compared to traditional methods. Preliminary tests of the CaloHit approach showed promising results, indicating the feasibility of scaling this method to more complex and higher-dimensional datasets. In conclusion, this thesis contributes to the advancement of calorimeter surrogate modeling by introducing and refining innovative generative models that effectively handle the complexities of high-granularity, sparse data. The proposed methods lay the groundwork for scalable, efficient, and experimentally validated simulation tools. Future work will focus on further improving these models, exploring more sophisticated techniques such as diffusion models or conditional flow matching, and validating their performance in real experimental settings. The developments presented here hold significant potential for enhancing the efficiency and accuracy of particle physics simulations, ultimately aiding in the pursuit of new discoveries in the field.

OpenAccess:
Volltext herunterladen PDF
(zusätzliche Dateien)

Dokumenttyp
Dissertation / PhD Thesis

Format
online

Sprache
English

Externe Identnummern
HBZ: HT031235341

Interne Identnummern
RWTH-2025-06385
Datensatz-ID: 1015426

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Dokumenttypen > Qualifikationsschriften > Dissertationen
Fakultät für Mathematik und Naturwissenschaften (Fak.1) > Fachgruppe Physik
Publikationsserver / Open Access
Öffentliche Einträge
Publikationsdatenbank
130000
131910

 Datensatz erzeugt am 2025-07-25, letzte Änderung am 2025-09-29


Dieses Dokument bewerten:

Rate this document:
1
2
3
 
(Bisher nicht rezensiert)