h1

h2

h3

h4

h5
h6


001     953804
005     20241118101500.0
024 7 _ |a 10.18154/RWTH-2023-02709
|2 datacite_doi
037 _ _ |a RWTH-2023-02709
041 _ _ |a English
082 _ _ |a 004
100 1 _ |0 P:(DE-82)954200
|a Hilgers, Tom
|b 0
|u rwth
245 _ _ |a Designing a static performance model and code generation for vector accelerators and parallel patterns
|c Tom Hilgers
|h online
246 _ 3 |a Entwurf eines statischen Leistungsmodells und Codegenerierung für Vektorbeschleuniger und Parallele Muster
|y German
260 _ _ |a Aachen
|b RWTH Aachen University
|c 2023
300 _ _ |a 1 Online-Ressource : Illustrationen, Diagramme
336 7 _ |0 2
|2 EndNote
|a Thesis
336 7 _ |0 PUB:(DE-HGF)2
|2 PUB:(DE-HGF)
|a Bachelor Thesis
|b bachelor
|m bachelor
336 7 _ |2 BibTeX
|a MASTERSTHESIS
336 7 _ |2 DRIVER
|a bachelorThesis
336 7 _ |2 DataCite
|a Output Types/Supervised Student Publication
336 7 _ |2 ORCID
|a SUPERVISED_STUDENT_PUBLICATION
500 _ _ |a Veröffentlicht auf dem Publikationsserver der RWTH Aachen University
502 _ _ |a Bachelorarbeit, RWTH Aachen University, 2023
|b Bachelorarbeit
|c RWTH Aachen University
|d 2023
|g Fak01
|o 2023-01-13
520 3 _ |a Moderne Supercomputersysteme haben eine verteilte und heterogene Struktur, die verschiedene Recheneinheiten wie CPUs, GPUs und andere Beschleuniger umfasst. Die Parallel Pattern Language (PPL) ermöglicht die hardwareunabhängige Programmierung solcher Systeme mit parallelen Mustern und generiert global optimierten Code unter Verwendung des Roofline Leistungsmodells. Diese Arbeit zielt darauf ab, die PPL zu erweitern, um Vektorbeschleuniger (VB) zu unterstützen, welche eine höhere Energieeffizienz als die gängigsten Recheneinheiten bieten. Das Roofline Modell wird erweitert, indem die besonderen architektonischen Merkmale von VBs berücksichtigt werden, wodurch eine Genauigkeit von ∼80% bis 99% erreicht wird. Die PPL-Komponenten werden hinsichtlich der notwendigen Änderungen für die VB-Codegenerierung analysiert. Die Generierung von funktionalem Code erfordert nur begrenzte Änderungen an der Codegeneratorkomponente. Die Steigerung der Effizienz von Datentransfers in diesem Code erfordert Änderungen an der Frontendsprache und der Intermediate Representation. Diese Vorschläge werden zum Teil in einem Proof-of-Concept umgesetzt, das in der Lage ist, funktionalen und korrekten Code für VBs zu erzeugen. Dieser Code wird evaluiert, um mögliche Leistungsverbesserungen zu ermitteln.
|l ger
520 _ _ |a Modern supercomputer systems have a distributed and heterogeneous structure that incorporates various compute units such as CPUs, GPUs, and other accelerators. The Parallel Pattern Language (PPL) enables the hardware-independent programming of such systems with parallel patterns and generates globally optimized code using the Roofline performance model. This thesis aims to extend the PPL to support Vector Accelerators (VAs), which offer a higher energy efficiency than the most common compute units. The Roofline model is extended by considering the special architectural features of VAs, which achieves an accuracy of ∼80% to 99%. The PPL components are analyzed regarding the necessary modifications for VA code generation. Generating functional code requires limited changes to the code generator component. Increasing the efficiency of data transfers in this code necessitates changes to the frontend language and intermediate representation. These proposals are partially implemented in a proof-of-concept that is capabable of generating functional and correct code for VAs. This code is evaluated to identify potential performance improvements.
|l eng
591 _ _ |a Germany
653 _ 7 |a HPC
653 _ 7 |a code generation
653 _ 7 |a parallel patterns
653 _ 7 |a performance model
653 _ 7 |a vector engine
700 1 _ |0 P:(DE-82)IDM01074
|a Müller, Matthias S.
|b 1
|e Thesis advisor
|u rwth
700 1 _ |0 P:(DE-82)IDM00515
|a Lankes, Stefan
|b 2
|e Thesis advisor
|u rwth
700 1 _ |0 P:(DE-82)954201
|a Burak, Semih
|b 3
|e Consultant
|u rwth
700 1 _ |0 P:(DE-82)IDM05459
|a Schmitz, Adrian
|b 4
|e Consultant
|u rwth
856 4 _ |u https://publications.rwth-aachen.de/record/953804/files/953804.pdf
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/953804/files/953804_source.zip
|y Restricted
909 C O |o oai:publications.rwth-aachen.de:953804
|p openaire
|p open_access
|p VDB
|p driver
|p dnbdelivery
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)954200
|a RWTH Aachen
|b 0
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM01074
|a RWTH Aachen
|b 1
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM00515
|a RWTH Aachen
|b 2
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)954201
|a RWTH Aachen
|b 3
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM05459
|a RWTH Aachen
|b 4
|k RWTH
914 1 _ |y 2023
915 _ _ |a OpenAccess
|0 StatID:(DE-HGF)0510
|2 StatID
920 1 _ |0 I:(DE-82)123010_20140620
|k 123010
|l Lehrstuhl für Informatik 12 (Hochleistungsrechnen)
|x 0
920 1 _ |0 I:(DE-82)120000_20140620
|k 120000
|l Fachgruppe Informatik
|x 1
920 1 _ |0 I:(DE-82)022000_20140101
|k 022000
|l IT Center
|x 2
980 _ _ |a I:(DE-82)022000_20140101
980 _ _ |a I:(DE-82)120000_20140620
980 _ _ |a I:(DE-82)123010_20140620
980 _ _ |a UNRESTRICTED
980 _ _ |a VDB
980 _ _ |a bachelor
980 1 _ |a FullTexts


LibraryCollectionCLSMajorCLSMinorLanguageAuthor
Marc 21