000953804 001__ 953804 000953804 005__ 20241118101500.0 000953804 0247_ $$2datacite_doi$$a10.18154/RWTH-2023-02709 000953804 037__ $$aRWTH-2023-02709 000953804 041__ $$aEnglish 000953804 082__ $$a004 000953804 1001_ $$0P:(DE-82)954200$$aHilgers, Tom$$b0$$urwth 000953804 245__ $$aDesigning a static performance model and code generation for vector accelerators and parallel patterns$$cTom Hilgers$$honline 000953804 246_3 $$aEntwurf eines statischen Leistungsmodells und Codegenerierung für Vektorbeschleuniger und Parallele Muster$$yGerman 000953804 260__ $$aAachen$$bRWTH Aachen University$$c2023 000953804 300__ $$a1 Online-Ressource : Illustrationen, Diagramme 000953804 3367_ $$02$$2EndNote$$aThesis 000953804 3367_ $$0PUB:(DE-HGF)2$$2PUB:(DE-HGF)$$aBachelor Thesis$$bbachelor$$mbachelor 000953804 3367_ $$2BibTeX$$aMASTERSTHESIS 000953804 3367_ $$2DRIVER$$abachelorThesis 000953804 3367_ $$2DataCite$$aOutput Types/Supervised Student Publication 000953804 3367_ $$2ORCID$$aSUPERVISED_STUDENT_PUBLICATION 000953804 502__ $$aBachelorarbeit, RWTH Aachen University, 2023$$bBachelorarbeit$$cRWTH Aachen University$$d2023$$gFak01$$o2023-01-13 000953804 500__ $$aVeröffentlicht auf dem Publikationsserver der RWTH Aachen University 000953804 5203_ $$aModerne Supercomputersysteme haben eine verteilte und heterogene Struktur, die verschiedene Recheneinheiten wie CPUs, GPUs und andere Beschleuniger umfasst. Die Parallel Pattern Language (PPL) ermöglicht die hardwareunabhängige Programmierung solcher Systeme mit parallelen Mustern und generiert global optimierten Code unter Verwendung des Roofline Leistungsmodells. Diese Arbeit zielt darauf ab, die PPL zu erweitern, um Vektorbeschleuniger (VB) zu unterstützen, welche eine höhere Energieeffizienz als die gängigsten Recheneinheiten bieten. Das Roofline Modell wird erweitert, indem die besonderen architektonischen Merkmale von VBs berücksichtigt werden, wodurch eine Genauigkeit von ∼80% bis 99% erreicht wird. Die PPL-Komponenten werden hinsichtlich der notwendigen Änderungen für die VB-Codegenerierung analysiert. Die Generierung von funktionalem Code erfordert nur begrenzte Änderungen an der Codegeneratorkomponente. Die Steigerung der Effizienz von Datentransfers in diesem Code erfordert Änderungen an der Frontendsprache und der Intermediate Representation. Diese Vorschläge werden zum Teil in einem Proof-of-Concept umgesetzt, das in der Lage ist, funktionalen und korrekten Code für VBs zu erzeugen. Dieser Code wird evaluiert, um mögliche Leistungsverbesserungen zu ermitteln.$$lger 000953804 520__ $$aModern supercomputer systems have a distributed and heterogeneous structure that incorporates various compute units such as CPUs, GPUs, and other accelerators. The Parallel Pattern Language (PPL) enables the hardware-independent programming of such systems with parallel patterns and generates globally optimized code using the Roofline performance model. This thesis aims to extend the PPL to support Vector Accelerators (VAs), which offer a higher energy efficiency than the most common compute units. The Roofline model is extended by considering the special architectural features of VAs, which achieves an accuracy of ∼80% to 99%. The PPL components are analyzed regarding the necessary modifications for VA code generation. Generating functional code requires limited changes to the code generator component. Increasing the efficiency of data transfers in this code necessitates changes to the frontend language and intermediate representation. These proposals are partially implemented in a proof-of-concept that is capabable of generating functional and correct code for VAs. This code is evaluated to identify potential performance improvements.$$leng 000953804 591__ $$aGermany 000953804 653_7 $$aHPC 000953804 653_7 $$acode generation 000953804 653_7 $$aparallel patterns 000953804 653_7 $$aperformance model 000953804 653_7 $$avector engine 000953804 7001_ $$0P:(DE-82)IDM01074$$aMüller, Matthias S.$$b1$$eThesis advisor$$urwth 000953804 7001_ $$0P:(DE-82)IDM00515$$aLankes, Stefan$$b2$$eThesis advisor$$urwth 000953804 7001_ $$0P:(DE-82)954201$$aBurak, Semih$$b3$$eConsultant$$urwth 000953804 7001_ $$0P:(DE-82)IDM05459$$aSchmitz, Adrian$$b4$$eConsultant$$urwth 000953804 8564_ $$uhttps://publications.rwth-aachen.de/record/953804/files/953804.pdf$$yOpenAccess 000953804 8564_ $$uhttps://publications.rwth-aachen.de/record/953804/files/953804_source.zip$$yRestricted 000953804 909CO $$ooai:publications.rwth-aachen.de:953804$$pdnbdelivery$$pdriver$$pVDB$$popen_access$$popenaire 000953804 9141_ $$y2023 000953804 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess 000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)954200$$aRWTH Aachen$$b0$$kRWTH 000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM01074$$aRWTH Aachen$$b1$$kRWTH 000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM00515$$aRWTH Aachen$$b2$$kRWTH 000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)954201$$aRWTH Aachen$$b3$$kRWTH 000953804 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM05459$$aRWTH Aachen$$b4$$kRWTH 000953804 9201_ $$0I:(DE-82)123010_20140620$$k123010$$lLehrstuhl für Informatik 12 (Hochleistungsrechnen)$$x0 000953804 9201_ $$0I:(DE-82)120000_20140620$$k120000$$lFachgruppe Informatik$$x1 000953804 9201_ $$0I:(DE-82)022000_20140101$$k022000$$lIT Center$$x2 000953804 961__ $$c2023-03-24T09:52:19.924252$$x2023-03-16T18:03:13.235146$$z2023-03-24T09:52:19.924252 000953804 980__ $$aI:(DE-82)022000_20140101 000953804 980__ $$aI:(DE-82)120000_20140620 000953804 980__ $$aI:(DE-82)123010_20140620 000953804 980__ $$aUNRESTRICTED 000953804 980__ $$aVDB 000953804 980__ $$abachelor 000953804 9801_ $$aFullTexts