001018782 001__ 1018782 001018782 005__ 20251126054613.0 001018782 0247_ $$2HBZ$$aHT031290972 001018782 0247_ $$2Laufende Nummer$$a44752 001018782 0247_ $$2datacite_doi$$a10.18154/RWTH-2025-07969 001018782 037__ $$aRWTH-2025-07969 001018782 041__ $$aEnglish 001018782 082__ $$a620 001018782 1001_ $$0P:(DE-588)1378944011$$aIhsan, Ahmad Zainul$$b0$$urwth 001018782 245__ $$aEnabling the digital transformation in materials science and engineering: leveraging ontologies for knowledge representation, provenance, and text mining$$cvorgelegt von Ahmad Zainul Ihsan, M. Sc.$$honline 001018782 260__ $$aAachen$$bRWTH Aachen University$$c2025 001018782 300__ $$a1 Online-Ressource : Illustrationen 001018782 3367_ $$02$$2EndNote$$aThesis 001018782 3367_ $$0PUB:(DE-HGF)11$$2PUB:(DE-HGF)$$aDissertation / PhD Thesis$$bphd$$mphd 001018782 3367_ $$2BibTeX$$aPHDTHESIS 001018782 3367_ $$2DRIVER$$adoctoralThesis 001018782 3367_ $$2DataCite$$aOutput Types/Dissertation 001018782 3367_ $$2ORCID$$aDISSERTATION 001018782 502__ $$aDissertation, Rheinisch-Westfälische Technische Hochschule Aachen, 2025$$bDissertation$$cRheinisch-Westfälische Technische Hochschule Aachen$$d2025$$gFak05$$o2025-09-02 001018782 500__ $$aVeröffentlicht auf dem Publikationsserver der RWTH Aachen University 001018782 5203_ $$aDie digitale Transformation der Materialwissenschaft und Werkstofftechnik (MSE) ist unerlässlich, um die Entwicklung neuartiger Materialien zu beschleunigen und das Verständnis des Lebenszyklus von Materialien zu verbessern, der Rohstoffe, Funktionsmaterialien, technische Komponenten und vieles mehr umfasst. Diese Transformation beinhaltet die Integration von Berechnungsmethoden, Datenwissenschaft und künstlicher Intelligenz (KI), um den Bereich der MSE voranzutreiben. Die Heterogenität der Datenformate, unstrukturierte Informationen und die Reproduzierbarkeitskrise in der MSE stellen jedoch eine Herausforderung für die effektive Verwaltung, Wiederverwendung und Analyse von Daten dar. Diese These befasst sich mit diesen Herausforderungen, indem sie Ontologien als Grundlage für die semantische Datenanreicherung nutzt und die Wissensrepräsentation, die Herkunftsdokumentation und das Text-Mining erleichtert. Der erste Beitrag dieser Arbeit ist die Entwicklung der Dislocation Ontology (DISO), einer Ontologie, die das Fachwissen über lineare Defekte in kristallinen Materialien darstellt. Die Entwicklung von DISO wurde von dem Ziel angetrieben, die Dateninteroperabilität mit anderen MSE-bezogenen Daten zu erleichtern. DISO wurde mit der Elementary Multiperspective Material Ontology (EMMO) und der Materials Design Ontology (MDO) abgestimmt, um die Interoperabilität zu gewährleisten. Die Ontologie-Anpassung stellt die Versetzungssimulationsdaten effizient dar. Darüber hinaus stellen wir einen realen Anwendungsfall vor, bei dem diskrete Versetzungsdynamikdaten als Wissensgraph (DisLocKG) dargestellt werden, der die Beziehungen zwischen ihnen abbilden kann. Außerdem ist DisLocKG zugänglich, da wir einen SPARQL-Endpunkt entwickelt haben, der eine beträchtliche Flexibilität bei der Abfrage von DisLocKG bietet. Ein weiterer Beitrag dieser Arbeit ist die PRovenance Information for MAterials Science (PRIMA)-Ontologie, die zur Dokumentation von Herkunftsinformationen in der MSE-Forschung entwickelt wurde und die Zuverlässigkeit, Vertrauenswürdigkeit und Reproduzierbarkeit von Daten fördert. PRIMA wurde mit der Provenance Ontology (PROV-O) und der Platform Material Digital core ontology (PMDco) abgestimmt und anhand von Anwendungsfällen im Zusammenhang mit der Herstellung von metallischen Biomaterialien und Mikroskopiedaten evaluiert. Darüber hinaus wird in dieser Arbeit ein Rahmenwerk vorgestellt, das Large Language Models (LLMs) und Semantic-Web-Technologien integriert, um strukturierte Daten aus unstrukturierten Texten zur Materialsynthese zu extrahieren. Freitextdaten werden in maschinenlesbare Formate wie JSON umgewandelt und mithilfe einer Ontologie semantisch weiter angereichert. Das übergeordnete Ziel dieser Arbeit besteht darin, einen interdisziplinären Ansatz zu demonstrieren, der MSE-Wissen, Semantic-Web-Technologien und Natural Language Processing (NLP) integriert, um die digitale Transformation von MSE zu erleichtern. Die entwickelten Ontologien und Wissensgraphen sind für die Datenanreicherung und Interoperabilität von entscheidender Bedeutung und stellen sicher, dass die Materialdaten den FAIR-Datenprinzipien (Findable, Accessible, Interoperable, Reusable) entsprechen. Das LLMs-basierte Text-Mining-Framework bietet eine Strategie für den Umgang mit unstrukturierten Daten in Texten, die mit der Materialsynthese in Zusammenhang stehen, und ermöglicht die Generierung verknüpfter Daten und die Extraktion von Wissen. Trotz dieser Fortschritte bestehen weiterhin Herausforderungen bei der Erweiterung von DISO und DisLocKG auf neue Anwendungsfälle, der Verfeinerung von Datenmodellen und der Verbesserung der Verarbeitung langer Kontexte in LLMs. Zukünftige Arbeiten werden die Entwicklung von Programmierschnittstellen (APIs) für DisLocKG, die Erweiterung von PRIMA um Rechenmodule und die Erforschung effizienterer LLM-Architekturen für ein breiteres Spektrum von Text-Mining-Anwendungen umfassen. Wir stellen uns eine Zukunft vor, in der Semantic-Web-Technologien und KI zusammenkommen, um Maschinen in die Lage zu versetzen, wissenschaftliche Daten zu extrahieren, zu verarbeiten und zu verstehen, und so letztlich die digitale Transformation in der MSE voranzutreiben.$$lger 001018782 520__ $$aThe digital transformation of Materials Science and Engineering (MSE) is essential for accelerating the development of novel materials and enhancing understanding of the materials life cycle, encompassing raw resources, functional materials, engineered components, and beyond. This transformation entails integrating computational methods, data science, and artificial intelligence (AI) to advance the field of MSE. However, the heterogeneity of data formats, unstructured information, and the reproducibility crisis in MSE pose challenges to the effective management, reuse, and analysis of data. This thesis addresses these challenges by leveraging ontologies as the foundation for semantic data enrichment, facilitating knowledge representation, provenance documentation, and text mining. The first contribution of this work is the development of the Dislocation Ontology (DISO), an ontology that represents the domain knowledge of linear defects in crystalline materials. The development of DISO was driven by the objective of facilitating data interoperability with other MSE-related data. DISO was aligned with the Elementary Multiperspective Material Ontology (EMMO) and Materials Design Ontology (MDO) to ensure interoperability. The ontology alignment efficiently represents the dislocation simulation data. Moreover, we present a real-world use case of representing discrete dislocation dynamics data as a knowledge graph (DisLocKG), which can depict the relationships between them. Additionally, DisLocKG is accessible, as we developed a SPARQL endpoint that offers considerable flexibility when querying DisLocKG. Another contribution of this work is the PRovenance Information for MAterials Science (PRIMA) ontology, which was designed to document provenance information in MSE research, promoting data reliability, trustworthiness, and reproducibility. PRIMA was aligned with the Provenance Ontology (PROV-O) and the Platform Material Digital core ontology (PMDco) and was evaluated through use cases involving metallic biomaterial fabrication and microscopy data. Furthermore, this thesis presents a framework integrating Large Language Models (LLMs) and Semantic Web technologies to extract structured data from unstructured materials synthesis text. Free-text data is transformed into machine-readable formats such as JSON and further enriched semantically using an ontology. The overarching objective of this work is to demonstrate an interdisciplinary approach that integrates MSE knowledge, Semantic Web technologies, and Natural Language Processing (NLP) to facilitate the digital transformation of MSE. The developed ontologies and knowledge graphs are pivotal in data enrichment and interoperability, ensuring that materials data adhere to the FAIR (Findable, Accessible, Interoperable, Reusable) data principles. The LLMs-based text mining framework provides a strategy for handling unstructured data in materials synthesis-related text, enabling the generation of linked data and knowledge extraction. Despite these advances, challenges persist in expanding DISO and DisLocKG to new use cases, refining data models, and improving long-context processing in LLMs. Future works will entail the development of Application Programming Interfaces (APIs) for DisLocKG, extending PRIMA with computational modules, and exploring more efficient LLMs architectures for a more extensive range of text-mining applications. We envision a future where Semantic Web technologies and AI converge to enable machines to extract, process, and understand scientific data, ultimately driving the digital transformation in MSE.$$leng 001018782 536__ $$0G:(EU-Grant)759419$$aMuDiLingo - A Multiscale Dislocation Language for Data-Driven Materials Science (759419)$$c759419$$fERC-2017-STG$$x0 001018782 588__ $$aDataset connected to Lobid/HBZ 001018782 591__ $$aGermany 001018782 653_7 $$adigital transformation 001018782 653_7 $$adislocation 001018782 653_7 $$amaterials science and engineering 001018782 653_7 $$aontology 001018782 653_7 $$aprovenance 001018782 653_7 $$atext mining 001018782 7001_ $$0P:(DE-82)817486$$aSandfeld, Stefan$$b1$$eThesis advisor$$urwth 001018782 7001_ $$0P:(DE-82)IDM05798$$aKerzel, Ulrich Bernd$$b2$$eThesis advisor$$urwth 001018782 8564_ $$uhttps://publications.rwth-aachen.de/record/1018782/files/1018782.pdf$$yOpenAccess 001018782 8564_ $$uhttps://publications.rwth-aachen.de/record/1018782/files/1018782_source.zip$$yRestricted 001018782 909CO $$ooai:publications.rwth-aachen.de:1018782$$popenaire$$popen_access$$pdriver$$pVDB$$pec_fundedresources$$pdnbdelivery 001018782 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess 001018782 9141_ $$y2025 001018782 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-588)1378944011$$aRWTH Aachen$$b0$$kRWTH 001018782 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)817486$$aRWTH Aachen$$b1$$kRWTH 001018782 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM05798$$aRWTH Aachen$$b2$$kRWTH 001018782 9201_ $$0I:(DE-82)527210_20201120$$k527210$$lLehrstuhl für Datenwissenschaft und Informatik in der Materialwissenschaft (FZ Jülich)$$x0 001018782 9201_ $$0I:(DE-82)520000_20140620$$k520000$$lFachgruppe für Materialwissenschaft und Werkstofftechnik$$x1 001018782 961__ $$c2025-11-25T11:17:00.299990$$x2025-09-22T22:01:17.672063$$z2025-11-25T11:17:00.299990 001018782 9801_ $$aFullTexts 001018782 980__ $$aI:(DE-82)520000_20140620 001018782 980__ $$aI:(DE-82)527210_20201120 001018782 980__ $$aUNRESTRICTED 001018782 980__ $$aVDB 001018782 980__ $$aphd