000880335 001__ 880335 000880335 005__ 20250726040300.0 000880335 0247_ $$aG:(GEPRIS)462234017$$d462234017 000880335 035__ $$aG:(GEPRIS)462234017 000880335 040__ $$aGEPRIS$$chttp://gepris.its.kfa-juelich.de 000880335 150__ $$aMeanfield Theorie zur Analysis von Deep Learning Methoden$$y2021 - 2025 000880335 371__ $$aProfessor Dr. Michael Herty 000880335 450__ $$aDFG project G:(GEPRIS)462234017$$wd$$y2021 - 2025 000880335 5101_ $$0I:(DE-588b)2007744-0$$aDeutsche Forschungsgemeinschaft$$bDFG 000880335 550__ $$0G:(GEPRIS)441826958$$aSPP 2298: Theoretische Grundlagen von Deep Learning$$wt 000880335 680__ $$aKinetische Theorie hat sich in den letzten Jahren als eine mögliche geeignete mathematische Methode zur hierarchischen Beschreibung einer Vielzahl physikalischer, technischer und soziologischer Prozesse bewährt. Zum Beispiel können strukturbildende Mechanism als Konsequenz interagierender Partikelsysteme mit Hilfe kinetischer Theorie sichtbar und einer mathematischen Analyse zugänglich gemacht werden. Ausgangspunkt dieses Antrags ist die Beobachtung, dass einige moderne Learning Methods, zum Beispiel Deep Residual Neuronal Networks, mathematisch ebenfalls als interagierende Partikelsysteme formuliert werden können. Hierbei bildet der Zustand des Partikels den Aktivierungszustand eines Neurons ab. In diesem Antrag planen wir die existierenden Methoden der kinetischen Gastheorie und insbesondere des sog. Meanfield Grenzwertes zu nutzen, auf die Speizifika der Learning Methods zu adaptieren und zu erweitern, um schließlich eine mathematische Analyse dieser Methoden zu ermöglichen. Der Schwerpunkt der Untersuchung liegt hierbei auf den für einen Meanfield Grenzwert zugänglichen Deep Residual Neuronal Networks und Filtermethoden zum Erlernen von Modellparametern aus (verrauschten) Daten. Die u.U. zu erweiternden Methoden der kinetischen Gastheorie sollen benutzt werden, um an den geeignet und äquivalent reformulierten Dynamiken strukturbildende Mechanism erkennen und analysieren zu können. Neben der Erkenntnis über zugrundeliegende Wirkungsweisen der Lernverfahren ist auch das Ziel damit neue, beweisbar konvergente und stabile Verfahren zu entwickeln. Die herzuleitenden partiellen Differentialgleichungen des Meanfield und/oder kinetischen Grenzwertes sollen hierbei erlauben, die dafür nötige Struktur und Formulierung zu liefern. Beispiele für geplante Beiträge durch diesen Antrag sind schnelle und stabile Verfahren zum Trainieren (und Adaptieren) neuronaler Netze, Studien zur Robustheit im Hinblick auf zum Beispiel unsichere Daten, Fragen der Darstellbarkeit Neuronaler Netze und neue Verfahren für daten-basierte Parameterschätzungen. 000880335 909CO $$ooai:juser.fz-juelich.de:934897$$pauthority$$pauthority:GRANT 000880335 909CO $$ooai:juser.fz-juelich.de:934897 000880335 980__ $$aG 000880335 980__ $$aAUTHORITY