Maschinelles Lernen (ML): Konzepte und Typen¶

Siehe auch

DAG und Reproduzierbarkeit: Python4DataScience – DVC/DAG

Was ist Maschinelles Lernen (Machine Learning)?

Maschinelles Lernen (Machine Learning, ML) ist ein Teilgebiet der Künstlichen Intelligenz, das es Computern ermöglicht, aus Daten zu lernen, anstatt explizit programmiert zu werden. Es gibt drei Hauptarten des ML:

1. Überwachtes Lernen (Supervised Learning)¶

Beim überwachten Lernen werden Modelle mit gelabelten Daten trainiert.

Das bedeutet, dass für jeden Eingabedatensatz ein bekanntes Ziel existiert.

Das Ziel des Modells ist es, eine Funktion zu lernen, die den Zusammenhang zwischen Eingaben und Ausgaben erfasst.

Überwachtes Lernen kann sowohl für Regression als auch für Klassifikation genutzt werden.

Beispiele hierfür sind:

Klassifikation: Vorhersage diskreter Kategorien (z.B. Spam-Filter, Bilderkennung von Hunden und Katzen).
Regression: Vorhersage kontinuierlicher Werte (z.B. Hauspreisvorhersage anhand der Wohnfläche).

Theoretische Konzepte des überwachten Lernens¶

Trainingsprozess¶

Das Modell wird mit einem Trainingsdatensatz trainiert, in dem Eingaben (Features) und die zugehörigen Zielwerte (Labels) bekannt sind.
Die Lernfunktion (oft als Hypothesenfunktion bezeichnet) wird durch das Training optimiert.

Modellbewertung¶

Das trainierte Modell wird anhand neuer Daten getestet, um sicherzustellen, dass es generalisiert und nicht nur die Trainingsdaten auswendig gelernt hat.
Typische Metriken: Genauigkeit, Präzision, Recall und F1-Score, Mean Squared Error (MSE).

2. Unüberwachtes Lernen (Unsupervised Learning)¶

Beim unüberwachten Lernen gibt es keine gelabelten Daten.

Das Modell versucht, Muster oder Strukturen in den Daten zu entdecken.

Dies eignet sich besonders für Explorative Datenanalyse, bei der keine festen Kategorien bekannt sind.

Unüberwachtes Lernen kann direkt für Klassifikationsprobleme genutzt werden; aber nur indirekt für Regressionsprobleme, z.B. als Vorverarbeitungsschritt oder zur Merkmalextraktion, um Regression effektiver zu machen.

Typische Anwendungen sind:

Clustering

Ziel: Datenpunkte in Gruppen einteilen, basierend auf Ähnlichkeit.

Beispiele:

Kundensegmentierung für personalisierte Werbung.
Erkennung von ähnlichen Produkten in Online-Shops.
Gruppierung von genetischen Mustern in der Biologie.
Betrugserkennung durch Anomalie-Analyse in Banktransaktionen.

Dimensionsreduktion

Ziel: Komplexe Daten in eine einfachere Form umwandeln.

Beispiele:

Hauptkomponentenanalyse (PCA) zur Reduzierung hochdimensionaler Daten.
Visualisierung von großen Datenmengen.
Feature-Auswahl für effizientere Modellberechnungen.

Theoretische Konzepte des Unüberwachten Lernens¶

Clustering-Algorithmen¶

K-Means: teilt Daten in eine vordefinierte Anzahl von Clustern ein.
Hierarchisches Clustering: erstellt eine baumartige Struktur zur Clusterbildung.
DBSCAN: erkennt Cluster basierend auf der Dichte der Datenpunkte.

Dimensionsreduktionstechniken¶

PCA (Principal Component Analysis): extrahiert die wichtigsten Variablen aus großen Datensätzen.
t-SNE (t-Distributed Stochastic Neighbor Embedding): visualisiert komplexe Datensätze in 2D oder 3D.

Vergleich: Überwachtes vs. Unüberwachtes Lernen¶

**Abbildung 1:** Überwachtes Lernen vs. Unüberwachtes Lernen¶

Vergleich von Überwachtem und Unüberwachtem Lernen¶
Merkmal	Überwachtes Lernen	Unüberwachtes Lernen
Datenverfügbarkeit	Gelabelte Daten notwendig	Keine Labels erforderlich
Ziel	Vorhersage einer bekannten Zielvariable	Identifikation von Mustern oder Strukturen
Typische Algorithmen	Lineare Regression, Entscheidungsbäume, Neuronale Netze	K-Means, DBSCAN, PCA
Anwendungsbereiche	Klassifikation, Regression	Clustering, Dimensionsreduktion

3. Reinforcement Learning (Bestärkendes Lernen, RL)¶

Siehe auch

Reinforcement Learning (RL)

Definition¶

Beim Reinforcement Learning (Bestärkendes Lernen, RL) lernt ein Agent durch Interaktion mit einer Umgebung, wobei er Belohnungen oder Bestrafungen erhält.

Das Ziel des RL ist es, eine Optimierungsstrategie zu entwickeln, die langfristig die höchste Gesamtbelohnung erzielt.

Es handelt sich um eine Form des Lernens durch Versuch und Irrtum, ähnlich wie ein Mensch, der durch Erfahrung lernt.

Grundprinzipien von Reinforcement Learning¶

Beim Reinforcement Learning wird ein „Agent“ definiert, z.B. Roboter, der sich innerhalb einer Umgebung, z.B. in einem Raum, sich zurechtfinden soll, mit einem klar definierten Ziel vor dem Auge, z.B. den Ausgang zu finden. Der Agent bekommt keine klare Schrittreihenfolge vorgeschrieben, sondern hat Anweisungen für schrittweises Handeln und muss selbst herausfinden, wie er sich am besten zum Ziel kommt.

Auf Details gehen wir in einem späteren Abschnitt dieser Schulung ein.

Grundbegriffe:

Agent: Das KI-System, das lernt (z.B. ein Roboter, ein autonomes Auto, ein Schachprogramm).
Umgebung (Environment): Alles außerhalb des Agents, mit dem er interagiert.
Zustand (State): Eine Momentaufnahme der Umgebung, die den Agenten beeinflusst.
Aktion (Action): Eine Entscheidung, die der Agent in einem bestimmten Zustand trifft.
Belohnung (Reward): Eine numerische Bewertung der Aktion, die dem Agenten signalisiert, ob er sich der optimalen Lösung nähert oder nicht.
Richtlinien (Policy): Eine Strategie, die den besten nächsten Schritt für den Agenten bestimmt.
Qualitäts-Wert (Q-Value): Eine Bewertung, wie gut eine bestimmte Aktion in einem Zustand langfristig ist.

Beispiele für RL-Anwendungen¶

Spielstrategien:: AlphaGo von DeepMind besiegte menschliche Meister im Go-Spiel durch RL.
Autonome Fahrzeuge:: Lernen, sicher zu fahren, indem sie Belohnungen für sichere Entscheidungen erhalten.
Robotik:: Industrieroboter optimieren ihre Bewegungen, um Aufgaben effizienter zu erledigen.
Algorithmischer Handel:: KI-Agenten lernen, wann sie Aktien kaufen oder verkaufen sollen.

Wichtige RL-Algorithmen¶

Q-Learning:: Eine tabellenbasierte Methode zur Speicherung der besten Aktionen.
Deep Q-Networks (DQN):: Eine Erweiterung von Q-Learning unter Verwendung von neuronalen Netzen.
Policy-Gradient-Verfahren:: Statt Werte zu lernen, lernt das Modell direkt eine optimale Strategie.
Proximal Policy Optimization (PPO):: Häufig in modernen RL-Anwendungen eingesetzt (z. B. bei OpenAI Gym).

Herausforderungen im RL¶

Exploration vs. Exploitation:: Ein Agent muss entscheiden, ob er eine neue Strategie testet oder eine bereits bekannte, aber möglicherweise nicht optimale Strategie nutzt.
Belohnungsdesign:: Ein schlecht definierter Belohnungsmechanismus kann dazu führen, dass das Modell unerwartete oder unerwünschte Strategien lernt.
Rechenaufwand:: RL benötigt oft viele Trainingsdurchläufe und Rechenleistung.

4. Deep Learning (DL) als spezialisierte Form des ML¶

Definition¶

Deep Learning (DL) ist ein Teilgebiet des maschinellen Lernens, das auf künstlichen neuronalen Netzen (Artificial Neural Networks, ANNs) basiert.

Es verwendet mehrere Schichten von Neuronen (daher der Begriff „Deep“), um hochkomplexe Muster in Daten zu lernen.

Deep Learning ist besonders leistungsfähig bei Bildverarbeitung, Spracherkennung und natürlicher Sprachverarbeitung (NLP).

Aufbau eines neuronalen Netzes¶

Input Layer: Nimmt Daten auf (z.B. Pixelwerte eines Bildes).
Verborgene Schichten (Hidden Layers): Extrahieren Merkmale und erkennen Muster.
Ausgangsschicht (Output Layer): Gibt das Ergebnis der Berechnung aus (z.B. Klassifizierung in „Hund“ oder „Katze“).

Neural Network Aufbau — **Abbildung 1:** Neural Network grober Aufbau¶

Arten von neuronalen Netzwerken¶

Feedforward Neural Networks (FNN): Einfachste Form, bei der Informationen nur in eine Richtung fließen.
Convolutional Neural Networks (CNN): Besonders geeignet für Bildverarbeitung (z.B. Gesichtserkennung, medizinische Bilddiagnostik).
Recurrent Neural Networks (RNN): Nutzen vergangene Informationen zur Verarbeitung von sequenziellen Daten (z.B. Sprachverarbeitung, Zeitreihenanalyse).
Transformer-Modelle: Revolutionierten die Natürliche Sprachverarbeitung (NLP) (z.B. GPT-Modelle, BERT, T5).

Beispiele für Anwendungen von Deep Learning¶

Bilderkennung: Automatische Erkennung von Objekten in Bildern.
Sprachverarbeitung (NLP): Chatbots, automatische Übersetzungen (Google Translate, ChatGPT).
Autonome Systeme: Steuerung von selbstfahrenden Autos und Robotern.
Medizinische Diagnosen: Krebsfrüherkennung in MRT-Scans mit neuronalen Netzen.

Herausforderungen im Deep Learning¶

Erklärbarkeit: DL-Modelle sind oft Black Boxes, deren Entscheidungen schwer nachvollziehbar sind. Früher hielt man generell alle Machine Learning Modelle für Black Boxes, aber dann hat man für die „traditionellere“ ML-Modelle Wege gefunden, dass man von den Modell-Gewichten zu den Features zurückführen kann, warum ein Modell diese Vorhersage getroffen hat, z.B. shap Bibliothek.
Datenbedarf: Sehr große Mengen an Trainingsdaten sind notwendig.
Rechenleistung: DL benötigt leistungsfähige GPUs oder TPUs.

Zukunft von Deep Learning¶

Edge AI: Deep Learning wird zunehmend auf Edge-Geräten (Smartphones, IoT-Geräte) ausgeführt.
Hybride Systeme: Kombination von Deep Learning mit Reinforcement Learning für komplexe Entscheidungsprozesse.
Quanten-KI: Erste Ansätze zur Beschleunigung von Deep-Learning-Modellen mit Quantencomputing.