Bewertung und Optimierung der Vollständigkeit von Betriebsdaten im Kontext der Fehlerprädiktion

Schlegel, Peter; Schmitt, Robert H.; Kampker, Achim

doi:10.18154/RWTH-2022-10641

Bewertung und Optimierung der Vollständigkeit von Betriebsdaten im Kontext der Fehlerprädiktion = Assessing and optimizing completeness of operational data in the context of defect prediction

Schlegel, Peter^RWTH*

2022

VerantwortlichkeitsangabePeter Schlegel

Ausgabe1. Auflage

ImpressumAachen : Apprimus Verlag 2022

Umfang1 Online-Ressource : Illustrationen, Diagramme

ISBN978-3-98555-120-0

ReiheErgebnisse aus der Produktionstechnik ; 36/2022

Dissertation, RWTH Aachen University, 2022

Druckausgabe: 2022. - Auch veröffentlicht auf dem Publikationsserver der RWTH Aachen University

Genehmigende Fakultät
Fak04

Hauptberichter/Gutachter
Schmitt, Robert H. (Thesis advisor)^RWTH* ; Kampker, Achim (Thesis advisor)^RWTH*

Tag der mündlichen Prüfung/Habilitation
2022-07-04

Online
DOI: 10.18154/RWTH-2022-10641
URL: https://publications.rwth-aachen.de/record/856080/files/856080.pdf

Einrichtungen

Projekte

Inhaltliche Beschreibung (Schlagwörter)
data completeness (frei) ; data quality (frei) ; defect prediction (frei) ; predictive quality (frei) ; quality management (frei)

Thematische Einordnung (Klassifikation)
DDC: 620

Kurzfassung
Die Leistungsfähigkeit datenbasierter Modelle der Fehlerprädiktion hängt stark von der Qualität der zugrundeliegenden Daten und damit von deren Eignung für den individuellen Anwendungsfall ab. Als eine der zentralen Dimensionen der Datenqualität ist insbesondere die kontextspezifische Vollständigkeit von Betriebsdaten in der Praxis häufig nur unzureichend gegeben. Lücken in der Datenbasis hemmen damit massiv die Wertschöpfung aus Daten. Das Ziel dieser Arbeit ist daher die Schaffung von Transparenz durch die Bewertung der Vollständigkeit von in Betriebsdaten erfassten Informationen im Kontext der Fehlerprädiktion. Die Zielstellung umfasst darüber hinaus, diese Transparenz für die Optimierung ebenjener Vollständigkeit zu nutzen, um so die Eignung der Daten für die Fehlerprädiktion zu verbessern. Bestehende Ansätze basieren auf sehr generischen Bewertungsschemata ohne den Analysekontext der Fehlerprädiktion und weisen ein deutliches Defizit hinsichtlich der systematischen Optimierung der Vollständigkeit auf. Vor diesem Hintergrund erfolgt im Rahmen dieser Arbeit die Entwicklung einer Bewertungsmethodik, bestehend aus vier wesentlichen und aufeinander aufbauenden Modulen. Zunächst erfolgt im ersten Modul, der Prozess- und Informationsmodellierung, die Modellierung relevanter Prozesse der Produktionskette sowie die damit verknüpfte Aufnahme und Klassifizierung systemseitig erfasster Informationen. Durch deren Visualisierung wird eine Übersicht des Ist-Zustands der entlang der Produktionskette erfassten Informationen geschaffen. Im Rahmen des zweiten Moduls wird die Identifikation und Gewichtung potenzieller Fehlereinflussgrößen adressiert, um den Soll-Zustand der Informationserfassung im Kontext der Fehlerprädiktion zu ermitteln. Im Mittelpunkt dessen steht die Formulierung von kausalen Zusammenhängen in Form von quantitativen Thesen auf Basis von explizitem und implizitem Wissen. Der darauffolgende Vergleich von Ist- und Soll-Zustand erfolgt im dritten Modul in Form einer quantitativen Vollständigkeitsbewertung. Im Fokus dessen steht die Entwicklung einer kontextspezifischen Bewertungsmetrik. Durch eine qualitative Visualisierung der hieraus resultierenden Kennzahlen im Prozessmodell wird Transparenz in Bezug auf Lücken in der Informationserfassung geschaffen. Im vierten und letzten Modul wird die Ableitung konkreter Empfehlungen zur Optimierung der Vollständigkeit im Sinne einer modellbasierten Entscheidungsunterstützung expliziert. Dabei werden auf Basis der entwickelten Metrik modellgestützt Handlungsalternativen identifiziert und priorisiert, um die Vollständigkeit der in Betriebsdaten erfassten Informationen zu maximieren. Abschließend wird die entwickelte Methodik an einem Fallbeispiel aus der industriellen Praxis angewendet und validiert sowie die zugrundeliegende Lösungshypothese dieser Arbeit geprüft. Durch eine Vergleichsbetrachtung der Klassifikationsgüte prädiktiver Modelle mit den korrespondierenden Vollständigkeitskennzahlen kann im Rahmen des Fallbeispiels eine Verbesserung der kontextbezogenen Dateneignung unter Anwendung der Methodik gezeigt werden.

The performance of data-based defect prediction models strongly depends on the quality of the underlying data and thus on its suitability for the individual application. As one of the key dimensions of data quality, the context-specific completeness of operational data in particular is often insufficient in practice. Gaps in the database thus massively inhibit the creation of value from data.The objective of this work is therefore to create transparency by assessing the completeness of information captured in operational data in the context of defect prediction. Furthermore, the objective includes the utilization of this transparency for the optimization of completeness in order to improve suitability of data for defect prediction. Existing approaches are based on very generic assessment schemes without the analysis context of defect prediction and show a clear deficit regarding the systematic optimization of completeness. Given this background, the development of an assessment methodology consisting of four essential and sequential modules is carried out within the scope of this work.In the first module, the process and information modeling, relevant processes of the production chain are modelled and the information captured by systems is documented and classified. By visualizing this information, an overview of the actual state of the information captured along the production chain is created. The second module addresses the identification and weighting of potential defect influencing variables in order to determine the target state of information capture in the context of defect prediction. The focus of this is the formulation of causal relationships in the form of quantitative theses based on explicit and implicit knowledge. The following comparison of the actual and target state takes place in the third module in the form of a quantitative completeness assessment. The focus of this is the development of a context-specific assessment metric. Through a qualitative visualization of the resulting key indicators in the process model, transparency is created with regard to gaps in the capture of information. In the fourth and last module the derivation of concrete recommendations for the optimization of completeness in the sense of a model-based decision support is specified. Based on the developed metric, alternative measures are identified and prioritized in order to maximize the completeness of the information captured in the operational data.Lastly, the developed methodology is applied and validated on a case study from industrial practice and the fundamental solution hypothesis of this work is verified. By comparing the classification performance of predictive models with the corresponding completeness indicators, an improvement of the context-related data suitability can be shown by applying the methodology in the case study.

OpenAccess:
PDF
(additional files)