Lernpfad: Generative KI und LLMs
================================

Dieser Abschnitt führt durch die Konzepte der **generativen KI** und **Large Language Models (LLMs)** in einer klaren, praxisnahen Reihenfolge. Jedes Kapitel baut auf dem vorherigen auf: Am Ende eines Kapitels steht kurz, *was wir gelernt haben* und *warum das nächste Konzept folgt*.

Konzeptioneller Ablauf
----------------------

Der Lernpfad folgt genau dieser Progression:

.. code-block:: text

   Text  →  Tokens  →  Prompting  →  Embeddings  →  semantische Ähnlichkeit  →  Semantische Suche (Retrieval)  →  RAG  →  Grenzen  →  [optional: LLM-Interna / microGPT]

**Schritt für Schritt:**

1. **Text** – Ausgangspunkt: natürlichsprachliche Eingaben und Dokumente.
2. **Tokens** – LLMs arbeiten mit Einheiten (Tokens), nicht mit Rohtext. Tokenisierung zerlegt Text in diese Einheiten; Kontextlänge und Kosten werden in Token gemessen.
3. **Prompting** – Wie wir dem Modell Eingaben geben (Fragen, Anweisungen, Beispiele), damit es die gewünschte Art von Antwort liefert.
4. **Embeddings** – Texte werden zu Vektoren abgebildet; dadurch wird „Bedeutung“ im gleichen Raum darstellbar und vergleichbar.
5. **Semantische Ähnlichkeit** – Damit aus Vektoren echte **Suche** wird, brauchen wir ein Maß: Wie ähnlich sind zwei Vektoren? Die Kosinusähnlichkeit misst die „Richtung“ und ist die Brücke von Embeddings zur Suche.
6. **Semantische Suche (Retrieval)** – Im Korpus suchen wir die Chunks, deren Embeddings der Anfrage am ähnlichsten sind (Top-k). Das ist **Retrieval** – die Grundlage für RAG.
7. **RAG (Retrieval-Augmented Generation)** – Retrieval + LLM: Relevante Stellen aus den Dokumenten werden ermittelt und dem Modell als Kontext mitgegeben; das Modell antwortet auf Basis dieses Kontexts.
8. **Grenzen und Risiken** – Halluzinationen, Bias, Aktualität, Sicherheit – wichtig für den verantwortungsvollen Einsatz.
9. **Optional: LLM-Interna / microGPT-Walkthrough** – Wie ein Transformer grob aufgebaut ist (Attention, Next-Token-Prediction) bzw. wie ein minimales GPT im Code aussieht; für Interessierte.

Die gleichen Konzepte stecken hinter Produkten wie **ChatGPT**, **Claude**, **Gemini** oder **RAG-Copilots** – hier werden die Bausteine erklärt, die dort genutzt werden.

Hinweis zu den Kapiteln
-----------------------

* Die **Hauptkapitel** (Einführung → LLM-Intuition → Tokens → Prompting → Embeddings → Semantische Ähnlichkeit → Semantische Suche → RAG → Grenzen) bilden den Kern. Jedes Kapitel enthält einen kurzen Recap und leitet zum nächsten über.
* Das **Glossar (LLM-Lingo)** steht als Referenz zur Verfügung – Begriffe können dort jederzeit nachgeschlagen werden.
* **LLM-Interna**, **microGPT-Walkthrough** und **Theorie hinter Generativer KI** sind **optionale Vertiefungen** und erscheinen nach dem Haupt-Lernpfad.

Nächster Schritt
----------------

Weiter mit der **Einführung in Generative KI** (:doc:`genai_intro`) und danach **LLM-Intuition** (:doc:`llm_intuition`).