h1

h2

h3

h4

h5
h6


001     755345
005     20230408005846.0
024 7 _ |2 HBZ
|a HT019974024
024 7 _ |2 Laufende Nummer
|a 37919
024 7 _ |2 datacite_doi
|a 10.18154/RWTH-2019-01778
037 _ _ |a RWTH-2019-01778
041 _ _ |a English
082 _ _ |a 004
100 1 _ |0 P:(DE-588)1178542319
|a Springer, Paul
|b 0
|u rwth
245 _ _ |a High-performance tensor operations : tensor transpositions, spin summations, and tensor contractions
|c vorgelegt von Paul Springer, Master of Science
|h online
260 _ _ |a Aachen
|c 2019
300 _ _ |a 1 Online-Ressource (xiii, 169 Seiten) : Illustrationen
336 7 _ |0 2
|2 EndNote
|a Thesis
336 7 _ |0 PUB:(DE-HGF)11
|2 PUB:(DE-HGF)
|a Dissertation / PhD Thesis
|b phd
|m phd
336 7 _ |2 BibTeX
|a PHDTHESIS
336 7 _ |2 DRIVER
|a doctoralThesis
336 7 _ |2 DataCite
|a Output Types/Dissertation
336 7 _ |2 ORCID
|a DISSERTATION
500 _ _ |a Veröffentlicht auf dem Publikationsserver der RWTH Aachen University
502 _ _ |a Dissertation, RWTH Aachen University, 2019
|b Dissertation
|c RWTH Aachen University
|d 2019
|g Fak01
|o 2019-01-07
520 3 _ |a Diese Dissertation befasst sich mit der Entwicklung von neuartigen, hoch- performanten Algorithmen zur Ausführung von Tensor-Transpositionen, Spin-Summationen sowie Tensor-Kontraktionen. Eine zentrale Herausforderung, die diesen Operationen zugrunde liegt ist das komplexe Muster der Speicherzugriffe, welches aus der mehrdimensionalen Natur der Tensoren hervorgerufen wird; des Weiteren führen diese komplexen Speicherzugriffsmuster oftmals zu einer geringen Ausnutzung der CPU-eigenen Cachehierarchie und somit zu einer geringen Performanz. Um diese Ineffizienzen zu überkommen, werfen die entwickelten Algorithmen in dieser Dissertation einen speziellen Fokus auf die Ausnutzung der räumlichen sowie temporären Lokalität; dies führt zu strukturierten und vorteilhaften Speicherzugriffen und somit zu einer hohen Performanz. Da Tensor-Transpositionen, Spin-Summationen, und Tensor-Kontraktionen die haupt Performanz-Engpässe in vielen wissenschaftlichen Anwendungen darstellen, ist es das Ziel dieser Dissertation signifikante Beschleunigungen gegenüber hochmodernen Softwarelösungen für solche Operationen zu erzielen. Wir beschreiben einen Ansatz zu Tensor-Transpositionen, welcher nahezu die maximale Speicherbandbreite auf verschiedenen Rechnerarchitekturen erzielt. Des Weiteren präsentieren wir mehrere Algorithmen für Spin-Summationen aus dem Blickwinkel des hochperformanten Rechnens, welche sowohl die räumliche als auch die temporäre Lokalität der Spin-Summation ausnutzen. Darüber hinaus stellen wir eine neuartige GEMM-ähnliche Methodik für Tensor- Kontraktionen vor. Dieser Ansatz vermeidet die Nachteile vorheriger Verfahren—allem voran übermäßige Speicherzugriffe sowie ein erhöhter Speicherbedarf—und ist damit in der Lage, die Performanz-Kluft zwischen Tensor-Kontraktionen und hoch-performanten Matrix-Matrix Multiplikationen zu schließen.
|l ger
520 _ _ |a This dissertation is concerned with the development of novel high-performance algorithms for tensor transpositions, spin summations, and tensor contractions. A central challenge that is common to these operations is the complex memory access pattern, which is due to the multidimensional nature of tensors, and which often leads to a poor utilization of the CPU’s rich cache hierarchy and consequently to low performance. To overcome this inefficiency, the algorithms presented in this dissertation pay special attention to the exploitation of spatial as well as temporal locality, resulting in a preferable memory access pattern, and thus high performance. With tensor transpositions, spin summations, and tensor contractions being the major performance bottlenecks in many scientific applications, the goal of this dissertation is to provide significant speedups over other state-of-the-art software solutions for such operations. We describe an approach to tensor transpositions that is able to attain close-to-peak memory bandwidth across multiple architectures. We also present a high-performance perspective on spin summations and propose an algorithm that exploits both the spatial as well as temporal locality inherent to the problem. Finally, a novel GEMM-like methodology for tensor contractions is introduced; this approach avoids the drawbacks of previous approaches—namely excess memory accesses or an increased memory footprint—and is able to close the performance gap between tensor contractions and high-performance matrix-matrix multiplications.
|l eng
588 _ _ |a Dataset connected to Lobid/HBZ
591 _ _ |a Germany
653 _ 7 |a HPC
653 _ 7 |a dense linear algebra
653 _ 7 |a tensor
700 1 _ |0 P:(DE-82)IDM00518
|a Bientinesi, Paolo
|b 1
|e Thesis advisor
|u rwth
700 1 _ |a Wellein, Gerhard
|b 2
|e Thesis advisor
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345.pdf
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345_source.tar.gz
|y Restricted
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345.gif?subformat=icon
|x icon
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345.jpg?subformat=icon-1440
|x icon-1440
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345.jpg?subformat=icon-180
|x icon-180
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345.jpg?subformat=icon-640
|x icon-640
|y OpenAccess
856 4 _ |u https://publications.rwth-aachen.de/record/755345/files/755345.jpg?subformat=icon-700
|x icon-700
|y OpenAccess
909 C O |o oai:publications.rwth-aachen.de:755345
|p dnbdelivery
|p driver
|p VDB
|p open_access
|p openaire
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-588)1178542319
|a RWTH Aachen
|b 0
|k RWTH
910 1 _ |0 I:(DE-588b)36225-6
|6 P:(DE-82)IDM00518
|a RWTH Aachen
|b 1
|k RWTH
914 1 _ |y 2019
915 _ _ |0 StatID:(DE-HGF)0510
|2 StatID
|a OpenAccess
920 1 _ |0 I:(DE-82)123620_20140620
|k 123620
|l Lehr- und Forschungsgebiet für Algorithmen-Orientierte Code-Generierung für Hochleistungsrechnerarchitekturen
|x 0
920 1 _ |0 I:(DE-82)120000_20140620
|k 120000
|l Fachgruppe Informatik
|x 1
920 1 _ |0 I:(DE-82)080003_20140620
|k 080003
|l Aachen Institute for Advanced Study in Computational Engineering Science (AICES)
|x 2
980 1 _ |a FullTexts
980 _ _ |a I:(DE-82)080003_20140620
980 _ _ |a I:(DE-82)120000_20140620
980 _ _ |a I:(DE-82)123620_20140620
980 _ _ |a UNRESTRICTED
980 _ _ |a VDB
980 _ _ |a phd


LibraryCollectionCLSMajorCLSMinorLanguageAuthor
Marc 21