Reinforcement Learning (RL)

Recap der wichtigsten Themen des zweiten Tages

  • Wiederholung der zentralen Konzepte von Neuronalen Netzen und Deep Learning

  • Verständnis der Forwardpropagation und Backwardpropagation

  • Loss Functions und ihre Rolle in Gradient Descent

  • Diskussion über Anwendungen von CNNs für Bildklassifikation

  • MLOps: Training, Testing, Inferencing, CI/CD

  • Offene Fragen und Klarstellungen

Kapitel

Inhalte

Definitionen und Grundprinzipien (RL)

Konzepte, Agent, Umgebung, Belohnungen, Policy

Markov-Entscheidungsprozesse

Definition, Zustände, Aktionen, Wertfunktionen

Wertbasierte Methoden – Q-Learning

Theorie, Q-Tabelle, Deep Q-Networks (DQN)

Praxis: Q-Learning in OpenAI Gym

Implementierung mit Python