2024
Dissertation, RWTH Aachen University, 2024
Veröffentlicht auf dem Publikationsserver der RWTH Aachen University
Genehmigende Fakultät
Fak01
Hauptberichter/Gutachter
; ;
Tag der mündlichen Prüfung/Habilitation
2024-09-25
Online
DOI: 10.18154/RWTH-2024-09760
URL: http://publications.rwth-aachen.de/record/995165/files/995165.pdf
Einrichtungen
Projekte
Inhaltliche Beschreibung (Schlagwörter)
FAIR principles (frei) ; data access (frei) ; data lifecycle (frei) ; data sovereignty (frei) ; dataspaces (frei) ; information model (frei) ; interoperability (frei) ; semantic web (frei) ; semantics (frei)
Thematische Einordnung (Klassifikation)
DDC: 004
Kurzfassung
Die digitale Transformation verändert weltweit Branchen, Organisationen und Gesellschaften durch das exponentielle Wachstum von Daten. Diese Daten, ob offen oder vertraulich, treiben Innovationen und schaffen Wettbewerbsvorteile. Es wächst jedoch das Bedürfnis nach Datensouveränität, bei der Personen und Organisationen die Kontrolle über ihre Daten während des gesamten Lebenszyklus behalten. Initiativen wie Datenräume, die in Europa mit 4 bis 6 Milliarden Euro gefördert werden, und das Internet of Production konzentrieren sich auf Datenautonomie und -integration, doch Interoperabilität und gemeinsames Verständnis bleiben Herausforderungen. Semantic Web-Technologien und FAIR-Daten bieten Grundlagen für die Bewältigung dieser Herausforderungen, sind jedoch in Datenräumen noch nicht ausreichend genutzt. Diese Dissertation erforscht die semantischen Grundlagen von Datenräumen und integriert semantische Technologien zur Verbesserung der Dateninteroperabilität und des gemeinsamen Verständnisses. Zudem werden semantische Technologien weiterentwickelt, um ihre Wirkung zu verstärken. Diese Arbeit entwickelt neue Konzepte, Prinzipien, Best Practices und Lösungen zur Verbesserung des Datenmanagements in Datenräumen. Die Kernbeiträge dieser Arbeit sind:- Ein angepasstes Datenlebenszyklusmodell: Ein strukturiertes Modell zur Verwaltung von Daten und Metadaten in Datenräumen, welches die Herausforderungen und Anforderungen von Datenräumen berücksichtigt.- Prinzipien von Informationsmodellen: Ein gemeinsamer Kern für die strukturierte Darstellung von Daten, Diensten, Teilnehmern und Interaktionen als Grundlage für Datensouveränität und Interoperabilität.- Erweiterte Datenzugangsprinzipien: Für verschiedene Arten von Heterogenität eine Verbesserung der Datenzugänglichkeit von Daten durch Ressourcenmanagement, dynamische Datenänderungen und umfangreiche Metadaten. Dies erhöht die Quantität und Qualität von Informationen in Datenräumen.- Methoden zur Verbesserung des gemeinsamen Verständnisses: Techniken zur Identifizierung, Entwicklung von Vokabularen, Einbeziehung von Fachfremden, Empfehlungssysteme, Informationsaktualisierung über Zeit und Validierung zur Verbesserung der Dateninteroperabilität und -(nach)nutzung. Durch die Kombination dieser Beiträge integriert diese Arbeit semantische Technologien in Datenräume. Dies verbessert die Interoperabilität von Daten und Diensten, erleichtert ein gemeinsames Verständnis und fördert das Management und die Wiederverwendung von Daten während des gesamten Lebenszyklus. Diese Arbeit liefert Erkenntnisse über das effektive Management von Informationen im digitalen Ökosystem der Datenräume und trägt zum Fortschritt der datengetriebenen digitalen Transformation bei.Digital transformation is rapidly reshaping industries, organizations, and societies around the world, driven by the exponential growth of data from the Internet and the Web. This data, encompassing both open and closed resources, drives innovation and provides competitive advantages. However, there is a growing demand for data sovereignty, where individuals and organizations control their data throughout its lifecycle. Initiatives such as dataspaces, funded with €4-6 billion in Europe, and the Internet of Production focus on data autonomy and integration, but interoperability and common understanding remain critical challenges. The fields of Semantic Web technologies and FAIR data provide frameworks for addressing these challenges. These semantic technologies enable seamless data exchange and meaningful interpretation to maximize the potential of data, yet they are not sufficiently utilized in dataspaces. This thesis explores the semantic foundations of dataspaces, aiming to integrate semantic technologies to improve data interoperability and facilitate common understanding among stakeholders. It also advances semantic technologies to enhance their impact. This work proposes new concepts, principles, best practices, and solutions to improve data management in dataspaces. The key contributions of this thesis include:- A Tailored Data Lifecycle Model for Dataspaces: This model addresses the unique challenges and requirements of dataspaces, ensuring a streamlined and structured approach to managing data and metadata throughout their lifecycle.- Principles of Information Models: These models define a common core in dataspaces, providing a structured representation of data, services, participants, and interactions, and serving as a foundation for data sovereignty and interoperability mechanisms.- Extended Data Access Principles: These principles cover various types of heterogeneity, improving data accessibility by managing resource constraints, handling dynamic data changes, and providing rich metadata to increase the quantity and quality of information in dataspaces.- Methods for Improving Common Domain Understanding: This includes techniques for identification, best practices for vocabulary development, involvement of non-experts, effective recommendation systems, evolution of semantic information over time, and improved validation techniques to enhance data interoperability and (re)use in dataspaces. By combining these contributions, this thesis confidently integrates semantic technologies into dataspaces. This integration enhances data and service interoperability and facilitates common understanding within these environments, promoting proper data management and reuse throughout the data lifecycle. Our work provides valuable insights into the effective management of information within the digital ecosystem of dataspaces, contributing to the advancement of knowledge in today's data-driven digital transformation.
OpenAccess: PDF
(zusätzliche Dateien)
Dokumenttyp
Dissertation / PhD Thesis
Format
online
Sprache
English
Externe Identnummern
HBZ: HT030887920
Interne Identnummern
RWTH-2024-09760
Datensatz-ID: 995165
Beteiligte Länder
Germany
Talk (non-conference) (Other)
Semantic Foundations of Dataspaces
PhD Defense Johannes Theissen-Lipp, AachenAachen, Germany, 25 Sep 2024 - 25 Sep 2024
63 Folien (2024) [10.18154/RWTH-2024-09830]
Files
BibTeX |
EndNote:
XML,
Text |
RIS
![]() |
The record appears in these collections: |