000793967 001__ 793967 000793967 005__ 20230411161054.0 000793967 020__ $$a978-3-95806-478-2 000793967 0247_ $$2HBZ$$aHT020524239 000793967 0247_ $$2Laufende Nummer$$a39427 000793967 0247_ $$2datacite_doi$$a10.18154/RWTH-2020-07304 000793967 037__ $$aRWTH-2020-07304 000793967 041__ $$aEnglish 000793967 082__ $$a570 000793967 1001_ $$0P:(DE-588)1213687055$$aSprenger, Julia$$b0$$urwth 000793967 245__ $$aTools and workflows for data & metadata management of complex experiments : building a foundation for reproducible & collaborative analysis in the neurosciences$$cJulia Sprenger$$honline, print 000793967 260__ $$aJülich$$bForschungszentrum Jülich GmbH, Zentralbibliothek, Verlag$$c2020 000793967 300__ $$a1 Online-Ressource (X, 168 Seiten) : Illustrationen, Diagramme 000793967 3367_ $$02$$2EndNote$$aThesis 000793967 3367_ $$0PUB:(DE-HGF)11$$2PUB:(DE-HGF)$$aDissertation / PhD Thesis$$bphd$$mphd 000793967 3367_ $$0PUB:(DE-HGF)3$$2PUB:(DE-HGF)$$aBook$$mbook 000793967 3367_ $$2BibTeX$$aPHDTHESIS 000793967 3367_ $$2DRIVER$$adoctoralThesis 000793967 3367_ $$2DataCite$$aOutput Types/Dissertation 000793967 3367_ $$2ORCID$$aDISSERTATION 000793967 4900_ $$aSchriften des Forschungszentrums Jülich. Reihe Schlüsseltechnologien$$v222 000793967 500__ $$aDruckausgabe: 2020. - Onlineausgabe: 2020. - Auch veröffentlicht auf dem Publikationsserver der RWTH Aachen University 000793967 502__ $$aDissertation, RWTH Aachen University, 2020$$bDissertation$$cRWTH Aachen University$$d2020$$gFak01$$o2020-02-14 000793967 5203_ $$aDas wissenschaftliche Wissen der Menschheit basiert auf der Überprüfung von Hypothesen durch Experimente. Da der Aufbau und die Durchführung eines Experiments immer komplexer werden, werden immer mehr Wissenschaftler an einem einzigen Projekt beteiligt. Um die erzeugten Daten für alle Wissenschaftler und bestenfalls für die gesamte wissenschaftliche Gemeinschaft leicht zugänglich zu machen, ist es unerlässlich, die Umstände der Datengenerierung umfassend zu dokumentieren, da diese wesentliche Informationen für die spätere Analyse und Interpretation enthalten. In dieser Arbeit stelle ich zwei komplexe neurowissenschaftliche Projekte und die Strategien, Werkzeuge und Konzepte vor, mit denen die gesammelten Daten umfassend verfolgt, verarbeitet, organisiert und für die gemeinsame Analyse vorbereitet wurden. Zunächst beschreibe ich das ältere der beiden Experimente und erkläre detailliert die Erzeugung von Daten und Metadaten sowie die Pipeline zur Aggregation von Metadaten. Um die komplexe Metainformation dieses Projekts zu erfassen, wurde ein hierarchischer Ansatz auf Basis der Open-Source-Software odML für die Metadatenorganisation implementiert. Ich evaluiere die verwendeten Designkonzepte und Werkzeuge und leite daraus einen allgemeinen Anforderungskatalog für die wissenschaftliche Zusammenarbeit in komplexen Projekten ab. Außerdem identifiziere ich Probleme und Anforderungen, die durch diese Pipeline noch nicht gelöst wurden. Insbesondere bestand die Schwierigkeit darin, i) manuelle Metadaten einzugeben und die Metadatenerfassung zu strukturieren, ii) Metadaten mit den eigentlichen Daten zu kombinieren und iii) die Pipeline modular generisch und transparent aufzubauen. Anhand dieser Analyse beschreibe ich Konzept- und Tool-Implementierungen, um diese identifizierten Probleme anzugehen. Ich habe ein ergänzendes Werkzeug (odMLtables)entwickelt, um i) die strukturierte Erfassung von Metadaten zu erleichtern und ii) diese einfach in das hierarchische, standardisierte Metadatenformat odML zu konvertieren. odMLtables bietet eine Schnittstelle zwischen den leicht lesbaren tabellarischen Metadatenrepräsentation in den in Laborumgebungen gebräuchlichen Formaten (csv/xls) und dem hierarchisch organisierten odML-Format auf Basis von xml, das für eine um-fassende Sammlung komplexer Metadatensätze in leicht maschinenlesbarer Form konzipiert ist. Ergänzend zur koordinierten Erfassung von Metadaten habe ich die Neo Toolbox für die standardisierte Darstellung elektrophysiologischer Daten mitgestaltet. Diese Toolbox ist eine Schlüsselkomponente für die elektrophysiologische Datenanalyse, da sie verschiedene proprietäre und nicht-proprietäre Dateiformate integriert und als Brücke zwischen verschiedenen Dateiformaten dient. Ich betone neue Funktionen, die den Prozess des Daten- und Metadatenhandlings im Workflow der Datenerfassung vereinfachen. Ich führe das Konzept des Workflow-Managements in den Bereich der wissenschaftlichen Datenverarbeitung ein, basierend auf dem gängigen Python-basierten snakemake Paket. Für das zweite, neuere elektrophysiologische Experiment habe ich den Workflow zur Erfassung und Verpackung von Metadaten und Daten in einer umfassenden Form konzipiert und implementiert. Hier habe ich das generische neurowissenschaftliche Informationsaustauschformat (Nix) für die benutzerfreundliche Verpackung von Datensätzen mit Daten und Metadaten in kombinierter Form verwendet. Schließlich evaluiere ich den verbesserten Workflow anhand der Anforderungen an die wissenschaftliche Zusammenarbeit in komplexen Projekten. Ich erstelle allgemeine Richtlinien für die Durchführung solcher Experimente und Workflows in einem wissenschaftlichen Umfeld. Abschließend stelle ich die nächsten Entwicklungsschritte für den vorgestellten Workflow und mögliche Wege vor, diesen Prototyp als Serienprototypeiner breiteren wissenschaftlichen Gemeinschaft zur Verfügung zu stellen.$$lger 000793967 520__ $$aThe scientific knowledge of mankind is based on the verification of hypotheses by carrying out experiments. As the construction and conduct of an experiment becomes increasingly complex more and more scientists are involved in a single project. In order to make the generated data easily accessible to all scientists and, at best, to the entire scientific community, it is essential to comprehensively document the circumstances of the data generation, as these contain essential information for later analysis and interpretation. In this thesis, I present two complex neuroscience projects and the strategies, tools, and concepts that were used to comprehensively track, process, organize, and prepare the collected data for joint analysis. First, I describe the older of the two experiments and explain in detail the generation of data and metadata and the pipeline used for aggregating metadata. A hierarchical approach based on the open source software odMLfor metadata organization was implemented to capture the complex meta information of this project. I evaluate the design concepts and tools used and derive a general catalogue of requirements for scientific collaboration in complex projects. Also, I identify issues and requirements that were not yet addressed by this pipeline. There were, in particular, the difficulties in i) entering manual metadata and structuring the metadata collection, ii) combining metadata with the actual data, and iii) setting up the pipeline in a modular generic and transparent manner. Guided by this analysis, I describe concept and tool implementations to address these identified issues. I developed a complementary tool (odMLtables) to i) facilitate the capture of metadata in a structured way and to ii) convert these easily into the hierarchical, standardized metadata format odML. odMLtables provides an interface between the easy-to-read tabular metadata representation in the formats commonly used in lab-oratory environments (csv/xls) and the hierarchically organized odML format based on xml, which is designed for a comprehensive collection of complex metadata records in an easily machine-readable manner. Supplementing the coordinated capture of metadata, I contributed to and shaped the Neo toolbox for the standardized representation of electrophysiological data. This toolbox is a key component for electrophysiological data analysis as it integrates different proprietary and non-proprietary file formats and serves as a bridge between different file formats. I emphasize new features that simplify the process of data and metadata handling in the data acquisition workflow. I introduce the concept of workflow management into the field of scientific data pro-cessing, based on the common Python-based snake make package. For the second, more recent electrophysiological experiment, I designed and implemented the workflow for capturing and packaging metadata and data in a comprehensive form. Here I used the generic neuroscience information exchange format (Nix) for the user-friendly packaging of data sets including data and metadata in combined form. Finally, I evaluate the improved workflow against the requirements of collaborative scientific work in complex projects. I establish general guidelines for conducting such experiments and workflows in a scientific environment. In conclusion, I present the next development steps for the presented workflow and potential avenues for deploying this prototype as a production prototype to a wider scientific community.$$leng 000793967 588__ $$aDataset connected to Lobid/HBZ 000793967 591__ $$aGermany 000793967 653_7 $$aelectrophysiology 000793967 653_7 $$ametadata management 000793967 7001_ $$0P:(DE-82)IDM02445$$aGrün, Sonja Annemarie$$b1$$eThesis advisor$$urwth 000793967 7001_ $$0P:(DE-82)IDM01906$$aKampa, Björn Michael$$b2$$eThesis advisor$$urwth 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967.pdf$$yOpenAccess 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967_source.zip$$yRestricted 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967.gif?subformat=icon$$xicon$$yOpenAccess 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967.jpg?subformat=icon-1440$$xicon-1440$$yOpenAccess 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967.jpg?subformat=icon-180$$xicon-180$$yOpenAccess 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967.jpg?subformat=icon-640$$xicon-640$$yOpenAccess 000793967 8564_ $$uhttps://publications.rwth-aachen.de/record/793967/files/793967.jpg?subformat=icon-700$$xicon-700$$yOpenAccess 000793967 909CO $$ooai:publications.rwth-aachen.de:793967$$pdnbdelivery$$pdriver$$pVDB$$popen_access$$popenaire 000793967 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-588)1213687055$$aRWTH Aachen$$b0$$kRWTH 000793967 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM02445$$aRWTH Aachen$$b1$$kRWTH 000793967 9101_ $$0I:(DE-588b)36225-6$$6P:(DE-82)IDM01906$$aRWTH Aachen$$b2$$kRWTH 000793967 9141_ $$y2020 000793967 915__ $$0LIC:(DE-HGF)CCBY4$$2HGFVOC$$aCreative Commons Attribution CC BY 4.0 000793967 915__ $$0StatID:(DE-HGF)0510$$2StatID$$aOpenAccess 000793967 9201_ $$0I:(DE-82)163110_20180110$$k163110$$lLehr- und Forschungsgebiet Theoretische Systemneurobiologie (FZ Jülich)$$x0 000793967 9201_ $$0I:(DE-82)160000_20140620$$k160000$$lFachgruppe Biologie$$x1 000793967 961__ $$c2020-08-21T12:05:37.356230$$x2020-07-07T17:07:17.766230$$z2020-08-21T12:05:37.356230 000793967 9801_ $$aFullTexts 000793967 980__ $$aI:(DE-82)160000_20140620 000793967 980__ $$aI:(DE-82)163110_20180110 000793967 980__ $$aUNRESTRICTED 000793967 980__ $$aVDB 000793967 980__ $$abook 000793967 980__ $$aphd