Reinforcement Learning (RL) ============================================ **Recap der wichtigsten Themen des zweiten Tages** - Wiederholung der zentralen Konzepte von **Neuronalen Netzen und Deep Learning** - Verständnis der **Forwardpropagation und Backwardpropagation** - **Loss Functions und ihre Rolle in Gradient Descent** - Diskussion über Anwendungen von **CNNs für Bildklassifikation** - MLOps: Training, Testing, Inferencing, CI/CD - Offene Fragen und Klarstellungen .. list-table:: :header-rows: 1 * - Kapitel - Inhalte * - Definitionen und Grundprinzipien (RL) - Konzepte, Agent, Umgebung, Belohnungen, Policy * - Markov-Entscheidungsprozesse - Definition, Zustände, Aktionen, Wertfunktionen * - Wertbasierte Methoden – Q-Learning - Theorie, Q-Tabelle, Deep Q-Networks (DQN) * - Praxis: Q-Learning in OpenAI Gym - Implementierung mit Python .. toctree:: :hidden: :titlesonly: :maxdepth: 0 def mdp qlearn reinforcement_robotgridexit