2400258 – Deep Learning für Computer Vision II: Fortgeschrittene Themen
Tiefe faltende neuronale Netze (engl. Convolutional Neural Networks, CNNs) erzielen exzellente Ergebnisse in vielen Bereichen der Computer Vision, haben jedoch bei realen Anwendungen mit Herausforderungen zu kämpfen, wie die Abhängigkeit von kostspielig annotierten Trainingsdaten, hohe Rechenleistung oder schwere Nachvollziehbarkeit der Entscheidungswege. Während die Entwicklung der Erkennungsalgorithmen für lange Zeit primär von hohen Erkennungsraten auf großen und sauber annotierten Datensätzen getrieben waren, gewinnen heute anwendungsrelevante Ziele, wie Lernen mit wenig Trainingsdaten, Erklärbarkeit, Unsicherheitsschätzung oder Domänenadaption zunehmend an Bedeutung.
Die Vorlesung behandelt fortgeschrittene Netzarchitekturen, Lernverfahren und Forschungsgebiete im Bereich Deep Learning für Computer Vision. Es werden unter anderem folgende Themen behandelt:
- Überblick Deep Learning, Faltende Neuronale Netze (CNN), Probleme moderner Architekturen
- Interpretierbarkeit und Erklärbarkeit der CNNs
- Unsicherheit in Deep Learning
- Lernen mit wenig Trainingsdaten
- Effiziente Architekturen
- Fortgeschrittene Architekturen (Transformer, ...)
- Synergien von Computer Vision und Sprachmodellen
- Generative Modelle
- Kontinuierliches Lernen