Reinforcement Learning (RL)¶
Recap der wichtigsten Themen des zweiten Tages
Wiederholung der zentralen Konzepte von Neuronalen Netzen und Deep Learning
Verständnis der Forwardpropagation und Backwardpropagation
Loss Functions und ihre Rolle in Gradient Descent
Diskussion über Anwendungen von CNNs für Bildklassifikation
MLOps: Training, Testing, Inferencing, CI/CD
Offene Fragen und Klarstellungen
Kapitel |
Inhalte |
|---|---|
Definitionen und Grundprinzipien (RL) |
Konzepte, Agent, Umgebung, Belohnungen, Policy |
Markov-Entscheidungsprozesse |
Definition, Zustände, Aktionen, Wertfunktionen |
Wertbasierte Methoden – Q-Learning |
Theorie, Q-Tabelle, Deep Q-Networks (DQN) |
Praxis: Q-Learning in OpenAI Gym |
Implementierung mit Python |