h1

h2

h3

h4

h5
h6
000953804 001__ 953804
000953804 005__ 20241118101500.0
000953804 0247_ $$2datacite_doi$$a10.18154/RWTH-2023-02709
000953804 037__ $$aRWTH-2023-02709
000953804 041__ $$aEnglish
000953804 082__ $$a004
000953804 1001_ $$0P:(DE-82)954200$$aHilgers, Tom$$b0$$urwth
000953804 245__ $$aDesigning a static performance model and code generation for vector accelerators and parallel patterns$$cTom Hilgers$$honline
000953804 246_3 $$aEntwurf eines statischen Leistungsmodells und Codegenerierung für Vektorbeschleuniger und Parallele Muster$$yGerman
000953804 260__ $$aAachen$$bRWTH Aachen University$$c2023
000953804 300__ $$a1 Online-Ressource : Illustrationen, Diagramme
000953804 3367_ $$02$$2EndNote$$aThesis
000953804 3367_ $$0PUB:(DE-HGF)2$$2PUB:(DE-HGF)$$aBachelor Thesis$$bbachelor$$mbachelor
000953804 3367_ $$2BibTeX$$aMASTERSTHESIS
000953804 3367_ $$2DRIVER$$abachelorThesis
000953804 3367_ $$2DataCite$$aOutput Types/Supervised Student Publication
000953804 3367_ $$2ORCID$$aSUPERVISED_STUDENT_PUBLICATION
000953804 502__ $$aBachelorarbeit, RWTH Aachen University, 2023$$bBachelorarbeit$$cRWTH Aachen University$$d2023$$gFak01$$o2023-01-13
000953804 500__ $$aVeröffentlicht auf dem Publikationsserver der RWTH Aachen University
000953804 5203_ $$aModerne Supercomputersysteme haben eine verteilte und heterogene Struktur, die verschiedene Recheneinheiten wie CPUs, GPUs und andere Beschleuniger umfasst. Die Parallel Pattern Language (PPL) ermöglicht die hardwareunabhängige Programmierung solcher Systeme mit parallelen Mustern und generiert global optimierten Code unter Verwendung des Roofline Leistungsmodells. Diese Arbeit zielt darauf ab, die PPL zu erweitern, um Vektorbeschleuniger (VB) zu unterstützen, welche eine höhere Energieeffizienz als die gängigsten Recheneinheiten bieten. Das Roofline Modell wird erweitert, indem die besonderen architektonischen Merkmale von VBs berücksichtigt werden, wodurch eine Genauigkeit von ∼80% bis 99% erreicht wird. Die PPL-Komponenten werden hinsichtlich der notwendigen Änderungen für die VB-Codegenerierung analysiert. Die Generierung von funktionalem Code erfordert nur begrenzte Änderungen an der Codegeneratorkomponente. Die Steigerung der Effizienz von Datentransfers in diesem Code erfordert Änderungen an der Frontendsprache und der Intermediate Representation. Diese Vorschläge werden zum Teil in einem Proof-of-Concept umgesetzt, das in der Lage ist, funktionalen und korrekten Code für VBs zu erzeugen. Dieser Code wird evaluiert, um mögliche Leistungsverbesserungen zu ermitteln.$$lger
000953804 520__ $$aModern supercomputer systems have a distributed and heterogeneous structure that incorporates various compute units such as CPUs, GPUs, and other accelerators. The Parallel Pattern Language (PPL) enables the hardware-independent programming of such systems with parallel patterns and generates globally optimized code using the Roofline performance model. This thesis aims to extend the PPL to support Vector Accelerators (VAs), which offer a higher energy efficiency than the most common compute units. The Roofline model is extended by considering the special architectural features of VAs, which achieves an accuracy of ∼80% to 99%. The PPL components are analyzed regarding the necessary modifications for VA code generation. Generating functional code requires limited changes to the code generator component. Increasing the efficiency of data transfers in this code necessitates changes to the frontend language and intermediate representation. These proposals are partially implemented in a proof-of-concept that is capabable of generating functional and correct code for VAs. This code is evaluated to identify potential performance improvements.$$leng
000953804 591__ $$aGermany
000953804 653_7 $$aHPC
000953804 653_7 $$acode generation
000953804 653_7 $$aparallel patterns
000953804 653_7 $$aperformance model
000953804 653_7 $$avector engine
000953804 7001_ $$0P:(DE-82)IDM01074$$aMüller, Matthias S.$$b1$$eThesis advisor$$urwth
000953804 7001_ $$0P:(DE-82)IDM00515$$aLankes, Stefan$$b2$$eThesis advisor$$urwth
000953804 7001_ $$0P:(DE-82)954201$$aBurak, Semih$$b3$$eConsultant$$urwth
000953804 7001_ $$0P:(DE-82)IDM05459$$aSchmitz, Adrian$$b4$$eConsultant$$urwth
000953804 8564_ $$uhttps://publications.rwth-aachen.de/record/953804/files/953804.pdf$$yOpenAccess
000953804 8564_ $$uhttps://publications.rwth-aachen.de/record/953804/files/953804_source.zip$$yRestricted
000953804 909CO $$ooai:publications.rwth-aachen.de:953804$$pdnbdelivery$$pdriver$$pVDB$$popen_access$$popenaire
000953804 9141_ $$y2023
000953804 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess
000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)954200$$aRWTH Aachen$$b0$$kRWTH
000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM01074$$aRWTH Aachen$$b1$$kRWTH
000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM00515$$aRWTH Aachen$$b2$$kRWTH
000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)954201$$aRWTH Aachen$$b3$$kRWTH
000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM05459$$aRWTH Aachen$$b4$$kRWTH
000953804 9201_ $$0I:(DE-82)123010_20140620$$k123010$$lLehrstuhl für Informatik 12 (Hochleistungsrechnen)$$x0
000953804 9201_ $$0I:(DE-82)120000_20140620$$k120000$$lFachgruppe Informatik$$x1
000953804 9201_ $$0I:(DE-82)022000_20140101$$k022000$$lIT Center$$x2
000953804 961__ $$c2023-03-24T09:52:19.924252$$x2023-03-16T18:03:13.235146$$z2023-03-24T09:52:19.924252
000953804 980__ $$aI:(DE-82)022000_20140101
000953804 980__ $$aI:(DE-82)120000_20140620
000953804 980__ $$aI:(DE-82)123010_20140620
000953804 980__ $$aUNRESTRICTED
000953804 980__ $$aVDB
000953804 980__ $$abachelor
000953804 9801_ $$aFullTexts