Einführung zu LLM (Large Language Models)

  • LLM-Lingo: Must-Know Terms

LLM-Lingo: Baseline & Fine-Tuning

  • Foundation Model:

    Ein großes, vortrainiertes KI-Modell, das als Basis für spezifischere Aufgaben genutzt wird.

  • Transformer:

    Architektur für neuronale Netzwerke, die auf selbst-attention basiert und die Grundlage für viele LLMs ist.

  • Prompting:

    Technik zur Steuerung eines LLMs durch gezielte Texteingaben.

  • Context-Length:

    Die maximale Anzahl an Token, die ein LLM in einer einzelnen Abfrage berücksichtigen kann.

  • Few-Shot Learning vs Zero-Shot Learning vs In-Context Learning:

    Methoden, wie Modelle mit wenigen oder keinen Beispielen neue Aufgaben lösen.

  • RAG (Retrieval-Augmented Generation):

    Eine Methode, um LLMs mit externen Datenquellen zu erweitern und aktuelle Informationen zu nutzen.

  • Knowledge Base (KB):

    Eine strukturierte Datensammlung zur Unterstützung von LLMs bei der Wissensabrufung.

  • Vector Database:

    Eine spezialisierte Datenbank für das Speichern und Abrufen von embeddings, um semantische Suchanfragen zu ermöglichen.

  • Fine-Tuning:

    Anpassung eines vortrainierten Modells auf spezifische Aufgaben durch weiteres Training mit neuen Daten.

  • Instruction Tuning:

    Spezialisierte Form des Fine-Tunings, bei dem Modelle für bestimmte Instruktionen optimiert werden.

  • Hallucination:

    Falsch generierte Informationen durch ein LLM, die nicht auf den Trainingsdaten basieren.

  • SFT (Supervised Fine-Tuning):

    Feinabstimmung eines Modells mit gekennzeichneten Daten.

  • Contrastive Learning:

    Trainingsmethode, die die Unterschiede zwischen ähnlichen und unähnlichen Datenpunkten lernt.

  • Pruning:

    Technik zur Reduzierung der Modellkomplexität durch Entfernen weniger wichtiger Parameter.

LLM-Lingo: RAG + LLM Agents

  • Chunking:

    Zerlegung von langen Texten in kleinere Abschnitte für bessere Verarbeitung durch LLMs.

  • Indexing:

    Prozess zur schnellen Suche und zum Abruf von Informationen aus einer Datenbank.

  • Embedded Model:

    Ein Modell, das Text oder andere Daten in numerische Vektoren umwandelt.

  • Vector Search:

    Suche innerhalb einer Vektordatenbank, um semantisch ähnliche Ergebnisse zu finden.

  • Retrieval:

    Abruf relevanter Informationen zur Verbesserung der Generierung durch ein LLM.

  • AGI (Artificial General Intelligence):

    Hypothetische KI mit menschenähnlicher Intelligenz und universeller Problemlösungsfähigkeit.

  • LLM Agent:

    Ein autonom arbeitendes KI-Modul, das durch LLMs gesteuert wird und Aktionen ausführt.

  • Agent Memory:

    Speichersystem für einen LLM-Agenten, um vergangene Interaktionen zu nutzen.

  • Agent Planning:

    Strategie, mit der LLM-Agenten langfristige Aktionen planen.

  • Function Calling:

    Prozess, bei dem ein LLM externe Funktionen oder APIs zur Verarbeitung von Aufgaben aufruft.

LLM-Lingo: Enterprise Ready LLMs

  • LLM Bias:

    Verzerrungen in der Modellvorhersage aufgrund von Trainingsdaten.

  • XAI (Explainable AI):

    Techniken zur Nachvollziehbarkeit und Erklärung von KI-Modellen.

  • Responsible AI:

    Ethik und Sicherheit im KI-Einsatz, um Fairness und Transparenz sicherzustellen.

  • AI Governance:

    Richtlinien und Prozesse zur Überwachung und Regulierung von KI-Systemen.

  • Compliance:

    Einhaltung gesetzlicher Vorgaben für den KI-Einsatz.

  • GDPR (General Data Protection Regulation):

    Europäische Datenschutzverordnung zur Regulierung personenbezogener Daten.

  • Alignment:

    Abstimmung von KI-Modellen mit menschlichen Werten und Sicherheitsrichtlinien.

  • Model Ethics:

    Ethikrichtlinien zur Vermeidung von Diskriminierung und Missbrauch durch KI.

  • PII (Personally Identifiable Information):

    Daten, die eine Person eindeutig identifizieren können.

  • LLMOps:

    Operationalisierung und Wartung von LLMs in produktiven Umgebungen.

LLM-Lingo: LLM Vulnerabilities and Attacks

  • Adversarial Attacks:

    Gezielte Angriffe zur Manipulation von KI-Modellen.

  • Black-Box Attacks:

    Angriffe auf Modelle ohne direkten Zugriff auf deren interne Strukturen.

  • White-Box Attacks:

    Angriffe mit vollständigem Wissen über das Zielmodell.

  • Vulnerability:

    Schwachstellen in KI-Modellen, die ausgenutzt werden können.

  • Deep Fakes:

    Manipulierte Bilder oder Videos, die durch generative KI erstellt wurden.

  • Jailbreaking:

    Umgehung von Sicherheitsmechanismen eines KI-Modells.

  • Prompt Injection:

    Manipulation eines LLMs durch gezielte Eingaben, um unerwünschte Antworten zu erzeugen.

  • Prompt Leaking:

    Ungewollte Offenlegung interner Modellinformationen durch spezielle Eingaben.

  • Red-Teaming:

    Sicherheitsprüfung eines KI-Systems durch gezielte Tests auf Schwachstellen.

  • Robustness:

    Widerstandsfähigkeit eines Modells gegenüber Angriffen oder fehlerhaften Eingaben.

  • Watermarking:

    Techniken zur Kennzeichnung von KI-generierten Inhalten.

Learning Paradigms

  • Unsupervised Learning:

    Lernen aus nicht gekennzeichneten Daten ohne direkte Vorgaben.

  • Supervised Learning:

    Lernen aus gekennzeichneten Daten mit definierten Zielwerten.

  • Reinforcement Learning:

    Lernen durch Belohnungen und Bestrafungen in einer Umgebung.

  • Meta-Learning:

    Lernen, wie man effizient neue Aufgaben erlernen kann.

  • Multi-Task Learning:

    Training eines Modells auf mehrere Aufgaben gleichzeitig.

  • Zero-Shot Learning:

    Fähigkeit eines Modells, neue Aufgaben ohne vorheriges Training zu lösen.

  • Few-Shot Learning:

    Lernen aus wenigen Beispielen zur Lösung neuer Aufgaben.

  • Online Learning:

    Kontinuierliches Training eines Modells mit neuen Daten.

  • Continual Learning:

    Fähigkeit eines Modells, Wissen über Zeit zu behalten und zu erweitern.

  • Federated Learning:

    Dezentrale Modelloptimierung über mehrere Datenquellen ohne direkte Datenweitergabe.

  • Adversarial Learning:

    Training eines Modells mit simulierten Angriffen zur Robustheitssteigerung.

  • Active Learning:

    Modell kann gezielt Daten zur Verbesserung anfordern.