h1

h2

h3

h4

h5
h6
http://join2-wiki.gsi.de/foswiki/pub/Main/Artwork/join2_logo100x88.png

An approach for global and local data lifecycle management with provenance and persistent identifiers = Ein Ansatz für globales und lokales Datenlebenszyklusmanagement mit Provenienz und persistenten Identifikatoren



Verantwortlichkeitsangabevorgelegt von Master of Science Lars Christoph Gleim

ImpressumAachen : RWTH Aachen University 2023

Umfang1 Online-Ressource : Illustrationen, Diagramme


Dissertation, RWTH Aachen University, 2023

Veröffentlicht auf dem Publikationsserver der RWTH Aachen University


Genehmigende Fakultät
Fak01

Hauptberichter/Gutachter
;

Tag der mündlichen Prüfung/Habilitation
2023-04-18

Online
DOI: 10.18154/RWTH-2023-04233
URL: https://publications.rwth-aachen.de/record/956518/files/956518.pdf

Einrichtungen

  1. Lehrstuhl für Informatik 5 (Informationssysteme und Datenbanken) (124510)
  2. Fachgruppe Informatik (120000)

Projekte

  1. WS-A.III - Functional Perspective (X080067-WS-A.III) (X080067-WS-A.III)
  2. DFG project 390621612 - EXC 2023: Internet of Production (IoP) (390621612) (390621612)
  3. SMITH - Medizininformatik-Konsortium (BMBF-01ZZ1803K) (BMBF-01ZZ1803K)

Inhaltliche Beschreibung (Schlagwörter)
FactDAG (frei) ; FactID (frei) ; Persistenz (frei) ; data sharing and reuse (frei) ; intelligent manufacturing (frei) ; internet of production (frei) ; interorganisationales Datenmanagement (frei) ; interorganizational data management (frei) ; persistence (frei) ; supply chain accountability and trusted traceability (frei)

Thematische Einordnung (Klassifikation)
DDC: 004

Kurzfassung
In Zeiten zunehmender organisationsübergreifender Zusammenarbeit, agiler Produktentwicklung und zunehmenden Informationsaustauschs in der gesamten Lieferkette der Unternehmen wird das Management des Datenlebenszyklus immer komplexer. Derzeitige Datenverwaltungspraktiken, die auf Data-Lake- und Data-Warehouse-Systemen basieren, können den industriellen Anforderungen von morgen nur schwer gerecht werden. Basierend auf den Grundlagen der Linked-Data-Technologie und den Prinzipien und Best Practices für auffindbares, zugängliches, interoperables und wiederverwendbares (FAIR) Datenmanagement beschreiben wir einen Ansatz für globales und lokales Datenlebenszyklusmanagement mit Provenienz und persistenten Identifikatoren. Wir bezeichnen diesen Ansatz als World Wide Data Management (WWDM). In dieser Arbeit definieren wir Schlüsseldienste, Grundsätze und bewährte Verfahren für WWDM und stellen eine Referenzarchitektur und -implementierung vor. Wir präsentieren FactID, einen neuartigen Ansatz zur dauerhaften Identifizierung und Archivierung von Ressourcen, der eine global verteilte Ressourcenpersistenz ermöglicht. Extended Memento, eine HTTP-Erweiterung zur Ermöglichung einheitlicher, von der Infrastruktur unabhängiger Datenpersistenz im industriellen Maßstab. FactDAG, ein Datenintegrations- und Interoperabilitätsmodell, das Daten über System- und Organisationsgrenzen hinweg, sowie entlang des gesamten Daten- und Produktlebenszyklus, mit Hilfe von Provenance-Links verknüpft. FactStack, eine Implementierung des FactDAG-Modells auf der Grundlage der Prinzipien von Linked Data und FAIR-Datenmanagement. ReShare, einen Ansatz, der eine überprüfbare Verantwortlichkeit für die gemeinsame Nutzung von Daten über Organisationsgrenzen hinweg ermöglicht, unter Verwendung des neuartigen Konzepts der Digital Transmission Contracts. FactFUSE, einen Ansatz, der das WWDM-Paradigma auf der Grundlage des FactStack-Systems mit herkömmlichen hierarchischen Dateisystemen integriert, um die praktische Benutzerfreundlichkeit und die Einführung des Gesamtparadigmas zu unterstützen. Durch die Kombination dieser Beiträge wird die Suite von Datenverwaltungsdiensten, die den Kern des WWDM-Paradigmas bildet, in einer interoperablen und nachhaltigen Weise realisiert, die eine durchgängige Lenkung und Unterstützung der Datenverwaltung während ihres gesamten Lebenszyklus ermöglicht. Damit liefern die vorgestellten Ergebnisse eine praktische Grundlage für die interorganisationale Datenverwaltung und Zusammenarbeit mit minimalem operativem Aufwand, so als würden die Daten lokal verwaltet, was das FAIR-Datenmanagement über den gesamten Produktlebenszyklus und die Unternehmenslieferkette hinweg ermöglicht und die Grundlage für die agile Produktentwicklung und Zusammenarbeit in der Industrie 4.0 und darüber hinaus bildet.

Data lifecycle management is gaining in complexity in times of increasing interorganizational collaboration, agile product development, and growing information sharing throughout the enterprise supply chain. Current data management practices based on data lake and data warehouse systems are struggling to scale to the industrial requirements of tomorrow. Based on the foundations of Linked Data technology and principles and best practices for findable, accessible, interoperable and reusable (FAIR) data management, we describe an approach for global and local data lifecycle management with provenance and persistent identifiers. We refer to this approach as World Wide Data Management (WWDM). Throughout this work, we define key services, principles, and best practices for WWDM and provide a reference architecture and implementation. We present: FactID a novel approach for persistent resource identification and archiving enabling globally-distributed resource persistence. Extended Memento an Hyper Text Transfer Protocol (HTTP) extension for enabling uniform infrastructure-independent data persistence at industrial scale. FactDAG a data integration and interoperability model linking data across system, organizational boundaries, and throughout the data and product lifecycle using provenance links. FactStack an implementation of the FactDAG model based on the principles of Linked Data and FAIR data management. ReShare an approach enabling verifiable accountability for data sharing across organizational boundaries using the novel concept of Digital Transmission Contracts. FactFUSE an approach integrating the WWDM paradigm based on the FactStack system with traditional hierarchical file systems to support the practical usability and adoption of the overall paradigm. Through the combination of these contributions, the suite of data management services at the core of the WWDM paradigm is realized in an interoperable and sustainable fashion, guiding and supporting the data management throughout its lifecycle. As such, the presented results provide a practical foundation to enable interorganizational data management and collaboration with minimal operational overhead, promoting the adoption of FAIR data management principles and best practices throughout the product lifecycle and the enterprise supply chain. Subsequently, the described WWDM solution provides the foundation for next-generation data management practices for agile product development and collaboration in Industry 4.0 and beyond.

OpenAccess:
Download fulltext PDF
(additional files)

Dokumenttyp
Dissertation / PhD Thesis

Format
online

Sprache
English

Externe Identnummern
HBZ: HT030052995

Interne Identnummern
RWTH-2023-04233
Datensatz-ID: 956518

Beteiligte Länder
Germany

 GO


OpenAccess

QR Code for this record

The record appears in these collections:
Document types > Theses > Ph.D. Theses
Faculty of Mathematics, Computer Science and Natural Sciences (Fac.1) > Department of Computer Science
Publication server / Open Access
Public records
Publications database
120000
124510

 Record created 2023-04-20, last modified 2025-06-30


OpenAccess:
Download fulltext PDF
(additional files)
Rate this document:

Rate this document:
1
2
3
 
(Not yet reviewed)