000995779 001__ 995779 000995779 005__ 20241228050148.0 000995779 0247_ $$2datacite_doi$$a10.18154/RWTH-2024-10149 000995779 037__ $$aRWTH-2024-10149 000995779 041__ $$aEnglish 000995779 082__ $$a004 000995779 1001_ $$0P:(DE-82)999824$$aDjebarov, Dlyaver$$b0$$urwth 000995779 245__ $$aExtending h5bench with I/O access patterns in common AI applications$$cDlyaver Djebarov$$honline 000995779 246_3 $$aErweiterung von h5bench um I/O-Zugriffsmuster in gängigen KI-Anwendungen$$yGerman 000995779 260__ $$aAachen$$bRWTH Aachen University$$c2024 000995779 300__ $$a1 Online-Ressource: Illustrationen 000995779 3367_ $$02$$2EndNote$$aThesis 000995779 3367_ $$0PUB:(DE-HGF)2$$2PUB:(DE-HGF)$$aBachelor Thesis$$bbachelor$$mbachelor 000995779 3367_ $$2BibTeX$$aMASTERSTHESIS 000995779 3367_ $$2DRIVER$$abachelorThesis 000995779 3367_ $$2DataCite$$aOutput Types/Supervised Student Publication 000995779 3367_ $$2ORCID$$aSUPERVISED_STUDENT_PUBLICATION 000995779 500__ $$aVeröffentlicht auf dem Publikationsserver der RWTH Aachen University 000995779 502__ $$aBachelorarbeit, RWTH Aachen University, 2024$$bBachelorarbeit$$cRWTH Aachen University$$d2024$$gFak01$$o2024-09-19 000995779 5203_ $$aDie rasche Einführung von Künstlicher Intelligenz (KI) in der wissenschaftlichen Datenverarbeitung erfordert neue Werkzeuge zur effektiven Bewertung der I/O-Leistung. HDF5 ist eines der Datenformate, die nicht nur in HPC, sondern auch in modernen KI-Anwendungen häufig verwendet werden. Die bestehenden Benchmarks sind jedoch unzureichend, um die aktuellen Herausforderungen von KI-Workloads zu bewältigen. In diesem Beitrag wird eine Erweiterung des bestehenden HDF5-Benchmarks - h5bench - vorgestellt, indem die gleiche Arbeitslast aus dem MLPerf Storage - DLIO Benchmark integriert wird. Diese Erweiterung ermöglicht es Nutzern, KI-Workloads zu testen, ohne dass sie Bibliotheken für maschinelles Lernen installieren müssen, was die Komplexität reduziert und die Nutzbarkeit des Benchmarks verbessert. Die experimentelle Analyse zeigt, dass die Erweiterung in der Lage ist, die bestehenden I/O-Muster mit leicht anpassbaren Konfigurationen zu replizieren, um verschiedene Skalierbarkeitstests durchzuführen.$$lger 000995779 520__ $$aRapid artificial intelligence (AI) adoption in scientific computing requires new tools to evaluate I/O performance effectively. HDF5 is one of the data formats commonly used not only in HPC applications but also in modern AI applications. However, the existing benchmarks are insufficient to address the current challenges posed by AI workloads. This thesis introduces an extension to the existing HDF5 benchmark, called h5bench, by incorporating the same workload from the MLPerf Storage - DLIO Benchmark. This extension allows users to test AI workloads without the need to install machine learning libraries, reducing complexity and enhancing the usability of the benchmark. The experimental analysis demonstrates that the extension managed to replicate the existing I/O patterns with easy-to-adjust configurations to perform various scalability tests.$$leng 000995779 591__ $$aGermany 000995779 653_7 $$aAI Workloads 000995779 653_7 $$aBenchmarking 000995779 653_7 $$aHDF5 000995779 653_7 $$aHPC 000995779 653_7 $$aI/O 000995779 653_7 $$aI/O Benchmark 000995779 653_7 $$aI/O Kernel 000995779 653_7 $$aMLPerf 000995779 653_7 $$ah5bench 000995779 7001_ $$0P:(DE-82)IDM01074$$aMüller, Matthias S.$$b1$$eThesis advisor$$urwth 000995779 7001_ $$0P:(DE-82)999825$$aNeuwirth, Sarah$$b2$$eThesis advisor 000995779 7001_ $$0P:(DE-82)IDM05706$$aLiem, Radita Tapaning Hesti$$b3$$eConsultant$$urwth 000995779 8564_ $$uhttps://publications.rwth-aachen.de/record/995779/files/995779.pdf$$yOpenAccess 000995779 909CO $$ooai:publications.rwth-aachen.de:995779$$popenaire$$popen_access$$pVDB$$pdriver$$pdnbdelivery 000995779 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)999824$$aRWTH Aachen$$b0$$kRWTH 000995779 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM01074$$aRWTH Aachen$$b1$$kRWTH 000995779 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM05706$$aRWTH Aachen$$b3$$kRWTH 000995779 9141_ $$y2024 000995779 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess 000995779 9201_ $$0I:(DE-82)123010_20140620$$k123010$$lLehrstuhl für Hochleistungsrechnen (Informatik 12)$$x0 000995779 9201_ $$0I:(DE-82)120000_20140620$$k120000$$lFachgruppe Informatik$$x1 000995779 9201_ $$0I:(DE-82)022000_20140101$$k022000$$lIT Center$$x2 000995779 961__ $$c2024-12-27T07:44:25.442911$$x2024-10-28T11:40:37.792102$$z2024-12-27T07:44:25.442911 000995779 9801_ $$aFullTexts 000995779 980__ $$aI:(DE-82)022000_20140101 000995779 980__ $$aI:(DE-82)120000_20140620 000995779 980__ $$aI:(DE-82)123010_20140620 000995779 980__ $$aUNRESTRICTED 000995779 980__ $$aVDB 000995779 980__ $$abachelor