Reinforcement Learning (RL)
============================================

**Recap der wichtigsten Themen des zweiten Tages**

- Wiederholung der zentralen Konzepte von **Neuronalen Netzen und Deep Learning**

- Verständnis der **Forwardpropagation und Backwardpropagation**

- **Loss Functions und ihre Rolle in Gradient Descent**

- Diskussion über Anwendungen von **CNNs für Bildklassifikation**

- MLOps: Training, Testing, Inferencing, CI/CD

- Offene Fragen und Klarstellungen


.. list-table::
   :header-rows: 1

   * - Kapitel
     - Inhalte
   * - Definitionen und Grundprinzipien (RL)
     - Konzepte, Agent, Umgebung, Belohnungen, Policy
   * - Markov-Entscheidungsprozesse
     - Definition, Zustände, Aktionen, Wertfunktionen
   * - Wertbasierte Methoden – Q-Learning
     - Theorie, Q-Tabelle, Deep Q-Networks (DQN)
   * - Praxis: Q-Learning in OpenAI Gym
     - Implementierung mit Python

.. toctree::
   :hidden:
   :titlesonly:
   :maxdepth: 0

   def
   mdp
   qlearn
   reinforcement_robotgridexit