h1

h2

h3

h4

h5
h6


001     972397
005     20241121095052.0
024 7 _ |a 10.18154/RWTH-2023-10152
|2 datacite_doi
037 _ _ |a RWTH-2023-10152
041 _ _ |a English
082 _ _ |a 004
100 1 _ |0 P:(DE-82)972610
|a Alt, Lukas
|b 0
|u rwth
245 _ _ |a Performance metrics for access pattern-aware analysis of heterogeneous memory power consumption in HPC
|c Lukas Alt
|h online
246 _ 3 |a Metriken zur Analyse des Energieverbrauchs von heterogenem Arbeitsspeicher im Hochleistungsrechnen unter Berücksichtigung der Zugriffsmuster
|y German
260 _ _ |a Aachen
|b RWTH Aachen University
|c 2023
300 _ _ |a 1 Online-Ressource : Illustrationen, Diagramme
336 7 _ |0 2
|2 EndNote
|a Thesis
336 7 _ |0 PUB:(DE-HGF)19
|2 PUB:(DE-HGF)
|a Master Thesis
|b master
|m master
336 7 _ |2 BibTeX
|a MASTERSTHESIS
336 7 _ |2 DRIVER
|a masterThesis
336 7 _ |2 DataCite
|a Output Types/Supervised Student Publication
336 7 _ |2 ORCID
|a SUPERVISED_STUDENT_PUBLICATION
500 _ _ |a Veröffentlicht auf dem Publikationsserver der RWTH Aachen University
502 _ _ |a Masterarbeit, RWTH Aachen University, 2023
|b Masterarbeit
|c RWTH Aachen University
|d 2023
|g Fak01
|o 2023-10-19
520 3 _ |a Als Reaktion auf die steigende Nachfrage nach Speicherkapazität und -performance hat die Heterogenität des Arbeitsspeichers im Hochleistungsrechnen zugenommen. Insbesondere werden neben DRAM auch Technologien wie High-Capacity Memory (HCM) und High-Bandwidth Memory (HBM) eingesetzt. Während der Energieverbrauch von DRAM in der Vergangenheit oft bei der Energieoptimierung auf Knotenebene vernachlässigt wurde, motiviert der erhöhte Energieverbrauch von HCM die Untersuchung des Energieverbrauchs von heterogenem Speicher auf aktuellen Architekturen mit unterschiedlichen Zugriffsmustern. Es wird eine Methode zur Messung des Energieverbrauchs des Speichers durch Hardware-Instrumentierung der Speichersteckplätze beschrieben und implementiert. Die so durchgeführten Messungen werden mit RAPL verglichen, einem Interface zur Begrenzung und Messung des Energieverbrauchs auf Intel Systemen. Die Ergebnisse zeigen, dass die RAPL Messungen für den Arbeitsspeicher erheblich - um bis zu 120%- von Referenzmessungen auf Intel Ice Lake-SP Systemen abweichen. Eine Diskussion möglicher Gründe ergab, dass die RAPL-Speicherdomäne möglicherweise Verluste auf der Spannungsreglerebene enthält. Die Genauigkeit der Referenzmessungen wurde durch den Vergleich von Ergebnissen aus der Literatur mit den Ergebnissen auf einer ähnlichen Architektur (Broadwell-EP) im Rahmen dieser Arbeit validiert. In dieser Arbeit werden die neuen Metriken DEL und DES für die Bewertung des Energieverbrauchs von heterogenem Arbeitsspeicher unter Berücksichtigung der Zugriffsmuster vorgestellt. Zusätzlich wurde die BpW-Metrik für die Charakterisierung der Speicherenergieeffizienz verwendet. Die Metriken basieren auf Energiemessungen, die auf der Ice Lake-Architektur mit DRAM und Intel Optane Persistent Memory (PMem) durchgeführt wurden. Die Ergebnisse zeigen, dass das Zugriffsmuster und die Anzahl der gleichzeitigen Speicherzugriffe den dynamischen Energieverbrauch erheblich beeinflussen. Außerdem zeigt sich, dass PMem im Idle-Betrieb pro Kapazität energieeffizienter als DRAM ist und sich somit besser für die Speicherung selten benötigter Daten eignet. Unter Last ist DRAM aber energieeffizienter als PMem. Die präsentierten Metriken werden dann zur Schätzung des Energieverbrauchs realer Anwendungen verwendet, gefolgt von einer Diskussion über die Anwendbarkeit dieses Ansatzes und Verbesserungsmöglichkeiten.
|l ger
520 _ _ |a In response to the rising demand for memory performance and capacity, memory heterogeneity in HPC systems increased. In particular, technologies such as high-bandwidth memory (HBM) and high-capacity memory (HCM) are employed in addition to DRAM. While the power consumption of the memory subsystem was often neglected in node-level power optimizations in the past, the increased power consumption by HCM motivates studying the energy consumption of heterogeneous memory on the latest architectures under workloads with different memory access patterns. A method for measuring the memory energy consumption using hardware instrumentation of memory slots is described and implemented. Measurements using this approach are compared to RAPL, a software interface for limiting and controlling power consumption on Intel systems. Results show that RAPL energy measurements for the memory domain can differ significantly - up to 120% - from reference measurements on Intel Ice Lake-SP systems. A discussion of possible reasons yields that the RAPL memory domain may include losses at the voltage regulator level. The accuracy of the reference measurements was validated by comparing the results from the literature to results obtained from a similar architecture (Broadwell-EP). This thesis presents the new metrics DEL and DES for heterogeneous memory energy evaluation using different memory access patterns. Additionally, the BpW metric was utilized for memory energy efficiency characterization. The metrics are based on the instrumented energy measurements conducted on the Ice Lake architecture equipped with DRAM and Intel Optane Persistent Memory (PMem). The results demonstrate that the memory access pattern and the concurrency in memory accesses significantly impact the memory’s dynamic energy consumption. Furthermore, it shows that PMem is more energy efficient per capacity than DRAM at idle and is better suited for storing rarely accessed data. When PMem is under load, DRAM is more energy efficient. The proposed metrics are then used to estimate the energy consumption of real-world applications, followed by a discussion on the applicability of this approach and potential improvements.
|l eng
591 _ _ |a Germany
700 1 _ |0 P:(DE-82)IDM01074
|a Müller, Matthias S.
|b 1
|e Thesis advisor
|u rwth
700 1 _ |0 P:(DE-82)IDM00515
|a Lankes, Stefan
|b 2
|e Thesis advisor
|u rwth
700 1 _ |0 P:(DE-82)951584
|a Kozhokanova, Anara
|b 3
|e Consultant
|u rwth
786 0 _ |0 21.11102/9ae657a2-3487-42be-b3fe-fc58886d7b63
|2 EPIC
856 4 _ |u https://publications.rwth-aachen.de/record/972397/files/972397.pdf
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/972397/files/972397_source.zip
|y Restricted
856 4 _ |u https://publications.rwth-aachen.de/record/972397/files/972397_AV.pdf
|y Restricted
856 4 _ |u https://publications.rwth-aachen.de/record/972397/files/972397_EINV.pdf
|y Restricted
909 C O |o oai:publications.rwth-aachen.de:972397
|p openaire
|p open_access
|p VDB
|p driver
|p dnbdelivery
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM01074
|a RWTH Aachen
|b 1
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM00515
|a RWTH Aachen
|b 2
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)951584
|a RWTH Aachen
|b 3
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)972610
|a RWTH Aachen
|b 0
|k RWTH
914 1 _ |y 2023
915 _ _ |a OpenAccess
|0 StatID:(DE-HGF)0510
|2 StatID
920 1 _ |0 I:(DE-82)022000_20140101
|k 022000
|l IT Center
|x 0
920 1 _ |0 I:(DE-82)123010_20140620
|k 123010
|l Lehrstuhl für Informatik 12 (Hochleistungsrechnen)
|x 1
920 1 _ |0 I:(DE-82)120000_20140620
|k 120000
|l Fachgruppe Informatik
|x 2
980 _ _ |a I:(DE-82)022000_20140101
980 _ _ |a I:(DE-82)120000_20140620
980 _ _ |a I:(DE-82)123010_20140620
980 _ _ |a UNRESTRICTED
980 _ _ |a VDB
980 _ _ |a master
980 1 _ |a FullTexts


LibraryCollectionCLSMajorCLSMinorLanguageAuthor
Marc 21