h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

Extending h5bench with I/O access patterns in common AI applications = Erweiterung von h5bench um I/O-Zugriffsmuster in gängigen KI-Anwendungen



VerantwortlichkeitsangabeDlyaver Djebarov

ImpressumAachen : RWTH Aachen University 2024

Umfang1 Online-Ressource: Illustrationen


Bachelorarbeit, RWTH Aachen University, 2024

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
; ;

Tag der mündlichen Prüfung/Habilitation
2024-09-19

Online
DOI: 10.18154/RWTH-2024-10149
URL: https://publications.rwth-aachen.de/record/995779/files/995779.pdf

Einrichtungen

  1. Lehrstuhl für Hochleistungsrechnen (Informatik 12) (123010)
  2. Fachgruppe Informatik (120000)
  3. IT Center (022000)

Inhaltliche Beschreibung (Schlagwörter)
AI Workloads (frei) ; Benchmarking (frei) ; HDF5 (frei) ; HPC (frei) ; I/O (frei) ; I/O Benchmark (frei) ; I/O Kernel (frei) ; MLPerf (frei) ; h5bench (frei)

Thematische Einordnung (Klassifikation)
DDC: 004

Kurzfassung
Die rasche Einführung von Künstlicher Intelligenz (KI) in der wissenschaftlichen Datenverarbeitung erfordert neue Werkzeuge zur effektiven Bewertung der I/O-Leistung. HDF5 ist eines der Datenformate, die nicht nur in HPC, sondern auch in modernen KI-Anwendungen häufig verwendet werden. Die bestehenden Benchmarks sind jedoch unzureichend, um die aktuellen Herausforderungen von KI-Workloads zu bewältigen. In diesem Beitrag wird eine Erweiterung des bestehenden HDF5-Benchmarks - h5bench - vorgestellt, indem die gleiche Arbeitslast aus dem MLPerf Storage - DLIO Benchmark integriert wird. Diese Erweiterung ermöglicht es Nutzern, KI-Workloads zu testen, ohne dass sie Bibliotheken für maschinelles Lernen installieren müssen, was die Komplexität reduziert und die Nutzbarkeit des Benchmarks verbessert. Die experimentelle Analyse zeigt, dass die Erweiterung in der Lage ist, die bestehenden I/O-Muster mit leicht anpassbaren Konfigurationen zu replizieren, um verschiedene Skalierbarkeitstests durchzuführen.

Rapid artificial intelligence (AI) adoption in scientific computing requires new tools to evaluate I/O performance effectively. HDF5 is one of the data formats commonly used not only in HPC applications but also in modern AI applications. However, the existing benchmarks are insufficient to address the current challenges posed by AI workloads. This thesis introduces an extension to the existing HDF5 benchmark, called h5bench, by incorporating the same workload from the MLPerf Storage - DLIO Benchmark. This extension allows users to test AI workloads without the need to install machine learning libraries, reducing complexity and enhancing the usability of the benchmark. The experimental analysis demonstrates that the extension managed to replicate the existing I/O patterns with easy-to-adjust configurations to perform various scalability tests.

OpenAccess:
Download fulltext PDF

Dokumenttyp
Bachelor Thesis

Format
online

Sprache
English

Interne Identnummern
RWTH-2024-10149
Datensatz-ID: 995779

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Bachelor Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Central and Other Institutions
Public records
Publications database
120000
123010
022000

 Record created 2024-10-28, last modified 2024-12-28


OpenAccess:
Download fulltext PDF
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)