001 | 953804 | ||
005 | 20241118101500.0 | ||
024 | 7 | _ | |a 10.18154/RWTH-2023-02709 |2 datacite_doi |
037 | _ | _ | |a RWTH-2023-02709 |
041 | _ | _ | |a English |
082 | _ | _ | |a 004 |
100 | 1 | _ | |0 P:(DE-82)954200 |a Hilgers, Tom |b 0 |u rwth |
245 | _ | _ | |a Designing a static performance model and code generation for vector accelerators and parallel patterns |c Tom Hilgers |h online |
246 | _ | 3 | |a Entwurf eines statischen Leistungsmodells und Codegenerierung für Vektorbeschleuniger und Parallele Muster |y German |
260 | _ | _ | |a Aachen |b RWTH Aachen University |c 2023 |
300 | _ | _ | |a 1 Online-Ressource : Illustrationen, Diagramme |
336 | 7 | _ | |0 2 |2 EndNote |a Thesis |
336 | 7 | _ | |0 PUB:(DE-HGF)2 |2 PUB:(DE-HGF) |a Bachelor Thesis |b bachelor |m bachelor |
336 | 7 | _ | |2 BibTeX |a MASTERSTHESIS |
336 | 7 | _ | |2 DRIVER |a bachelorThesis |
336 | 7 | _ | |2 DataCite |a Output Types/Supervised Student Publication |
336 | 7 | _ | |2 ORCID |a SUPERVISED_STUDENT_PUBLICATION |
500 | _ | _ | |a Veröffentlicht auf dem Publikationsserver der RWTH Aachen University |
502 | _ | _ | |a Bachelorarbeit, RWTH Aachen University, 2023 |b Bachelorarbeit |c RWTH Aachen University |d 2023 |g Fak01 |o 2023-01-13 |
520 | 3 | _ | |a Moderne Supercomputersysteme haben eine verteilte und heterogene Struktur, die verschiedene Recheneinheiten wie CPUs, GPUs und andere Beschleuniger umfasst. Die Parallel Pattern Language (PPL) ermöglicht die hardwareunabhängige Programmierung solcher Systeme mit parallelen Mustern und generiert global optimierten Code unter Verwendung des Roofline Leistungsmodells. Diese Arbeit zielt darauf ab, die PPL zu erweitern, um Vektorbeschleuniger (VB) zu unterstützen, welche eine höhere Energieeffizienz als die gängigsten Recheneinheiten bieten. Das Roofline Modell wird erweitert, indem die besonderen architektonischen Merkmale von VBs berücksichtigt werden, wodurch eine Genauigkeit von ∼80% bis 99% erreicht wird. Die PPL-Komponenten werden hinsichtlich der notwendigen Änderungen für die VB-Codegenerierung analysiert. Die Generierung von funktionalem Code erfordert nur begrenzte Änderungen an der Codegeneratorkomponente. Die Steigerung der Effizienz von Datentransfers in diesem Code erfordert Änderungen an der Frontendsprache und der Intermediate Representation. Diese Vorschläge werden zum Teil in einem Proof-of-Concept umgesetzt, das in der Lage ist, funktionalen und korrekten Code für VBs zu erzeugen. Dieser Code wird evaluiert, um mögliche Leistungsverbesserungen zu ermitteln. |l ger |
520 | _ | _ | |a Modern supercomputer systems have a distributed and heterogeneous structure that incorporates various compute units such as CPUs, GPUs, and other accelerators. The Parallel Pattern Language (PPL) enables the hardware-independent programming of such systems with parallel patterns and generates globally optimized code using the Roofline performance model. This thesis aims to extend the PPL to support Vector Accelerators (VAs), which offer a higher energy efficiency than the most common compute units. The Roofline model is extended by considering the special architectural features of VAs, which achieves an accuracy of ∼80% to 99%. The PPL components are analyzed regarding the necessary modifications for VA code generation. Generating functional code requires limited changes to the code generator component. Increasing the efficiency of data transfers in this code necessitates changes to the frontend language and intermediate representation. These proposals are partially implemented in a proof-of-concept that is capabable of generating functional and correct code for VAs. This code is evaluated to identify potential performance improvements. |l eng |
591 | _ | _ | |a Germany |
653 | _ | 7 | |a HPC |
653 | _ | 7 | |a code generation |
653 | _ | 7 | |a parallel patterns |
653 | _ | 7 | |a performance model |
653 | _ | 7 | |a vector engine |
700 | 1 | _ | |0 P:(DE-82)IDM01074 |a Müller, Matthias S. |b 1 |e Thesis advisor |u rwth |
700 | 1 | _ | |0 P:(DE-82)IDM00515 |a Lankes, Stefan |b 2 |e Thesis advisor |u rwth |
700 | 1 | _ | |0 P:(DE-82)954201 |a Burak, Semih |b 3 |e Consultant |u rwth |
700 | 1 | _ | |0 P:(DE-82)IDM05459 |a Schmitz, Adrian |b 4 |e Consultant |u rwth |
856 | 4 | _ | |u https://publications.rwth-aachen.de/record/953804/files/953804.pdf |y OpenAccess |
856 | 4 | _ | |u https://publications.rwth-aachen.de/record/953804/files/953804_source.zip |y Restricted |
909 | C | O | |o oai:publications.rwth-aachen.de:953804 |p openaire |p open_access |p VDB |p driver |p dnbdelivery |
910 | 1 | _ | |0 I:(DE-588b)36225-6 |6 P:(DE-82)954200 |a RWTH Aachen |b 0 |k RWTH |
910 | 1 | _ | |0 I:(DE-588b)36225-6 |6 P:(DE-82)IDM01074 |a RWTH Aachen |b 1 |k RWTH |
910 | 1 | _ | |0 I:(DE-588b)36225-6 |6 P:(DE-82)IDM00515 |a RWTH Aachen |b 2 |k RWTH |
910 | 1 | _ | |0 I:(DE-588b)36225-6 |6 P:(DE-82)954201 |a RWTH Aachen |b 3 |k RWTH |
910 | 1 | _ | |0 I:(DE-588b)36225-6 |6 P:(DE-82)IDM05459 |a RWTH Aachen |b 4 |k RWTH |
914 | 1 | _ | |y 2023 |
915 | _ | _ | |a OpenAccess |0 StatID:(DE-HGF)0510 |2 StatID |
920 | 1 | _ | |0 I:(DE-82)123010_20140620 |k 123010 |l Lehrstuhl für Informatik 12 (Hochleistungsrechnen) |x 0 |
920 | 1 | _ | |0 I:(DE-82)120000_20140620 |k 120000 |l Fachgruppe Informatik |x 1 |
920 | 1 | _ | |0 I:(DE-82)022000_20140101 |k 022000 |l IT Center |x 2 |
980 | _ | _ | |a I:(DE-82)022000_20140101 |
980 | _ | _ | |a I:(DE-82)120000_20140620 |
980 | _ | _ | |a I:(DE-82)123010_20140620 |
980 | _ | _ | |a UNRESTRICTED |
980 | _ | _ | |a VDB |
980 | _ | _ | |a bachelor |
980 | 1 | _ | |a FullTexts |
Library | Collection | CLSMajor | CLSMinor | Language | Author |
---|