SFB 1597 C04

Schnelles und effizientes Erlernen der Hyperparameterkontrolle für Deep Reinforcement Learning auf kleinen Datenmengen (C04)

CoordinatorNoor Awad, Ph.D. ; Professor Dr. Joschka Bödecker
Grant period2023 -
Funding bodyDeutsche Forschungsgemeinschaft
 DFG
IdentifierG:(GEPRIS)524730295

SFB 1597: Small Data

Note: Unser Ziel ist es, automatisierte Techniken zu entwickeln, um die Hyperparameter von Deep Reinforcement Learning (RL)-Ansätzen auf eine stichprobeneffiziente Weise für kleine Datensätze zu wählen und so Unsicherheit zu reduzieren. Wir werden geeignete Benchmarks erstellen und dann die Leistung von derzeit existierenden Hyperparameter-Optimierungsverfahren (HPO) untersuchen, um schließlich automatisierte Verfahren zu entwickeln. Dies beinhaltet eine dynamische Steuerung auf Meta-Ebene unter Verwendung eines robusten Hyperparameter-Transfers für Online-HPO für Offline-RL und neuronale Architektursuche.
   

Recent Publications

There are no publications


 Record created 2023-08-08, last modified 2024-11-27