Einführung zu LLM (Large Language Models)¶
LLM-Lingo: Must-Know Terms
LLM-Lingo: Baseline & Fine-Tuning¶
- Foundation Model:
Ein großes, vortrainiertes KI-Modell, das als Basis für spezifischere Aufgaben genutzt wird.
- Transformer:
Architektur für neuronale Netzwerke, die auf selbst-attention basiert und die Grundlage für viele LLMs ist.
- Prompting:
Technik zur Steuerung eines LLMs durch gezielte Texteingaben.
- Context-Length:
Die maximale Anzahl an Token, die ein LLM in einer einzelnen Abfrage berücksichtigen kann.
- Few-Shot Learning vs Zero-Shot Learning vs In-Context Learning:
Methoden, wie Modelle mit wenigen oder keinen Beispielen neue Aufgaben lösen.
- RAG (Retrieval-Augmented Generation):
Eine Methode, um LLMs mit externen Datenquellen zu erweitern und aktuelle Informationen zu nutzen.
- Knowledge Base (KB):
Eine strukturierte Datensammlung zur Unterstützung von LLMs bei der Wissensabrufung.
- Vector Database:
Eine spezialisierte Datenbank für das Speichern und Abrufen von embeddings, um semantische Suchanfragen zu ermöglichen.
- Fine-Tuning:
Anpassung eines vortrainierten Modells auf spezifische Aufgaben durch weiteres Training mit neuen Daten.
- Instruction Tuning:
Spezialisierte Form des Fine-Tunings, bei dem Modelle für bestimmte Instruktionen optimiert werden.
- Hallucination:
Falsch generierte Informationen durch ein LLM, die nicht auf den Trainingsdaten basieren.
- SFT (Supervised Fine-Tuning):
Feinabstimmung eines Modells mit gekennzeichneten Daten.
- Contrastive Learning:
Trainingsmethode, die die Unterschiede zwischen ähnlichen und unähnlichen Datenpunkten lernt.
- Pruning:
Technik zur Reduzierung der Modellkomplexität durch Entfernen weniger wichtiger Parameter.
LLM-Lingo: RAG + LLM Agents¶
- Chunking:
Zerlegung von langen Texten in kleinere Abschnitte für bessere Verarbeitung durch LLMs.
- Indexing:
Prozess zur schnellen Suche und zum Abruf von Informationen aus einer Datenbank.
- Embedded Model:
Ein Modell, das Text oder andere Daten in numerische Vektoren umwandelt.
- Vector Search:
Suche innerhalb einer Vektordatenbank, um semantisch ähnliche Ergebnisse zu finden.
- Retrieval:
Abruf relevanter Informationen zur Verbesserung der Generierung durch ein LLM.
- AGI (Artificial General Intelligence):
Hypothetische KI mit menschenähnlicher Intelligenz und universeller Problemlösungsfähigkeit.
- LLM Agent:
Ein autonom arbeitendes KI-Modul, das durch LLMs gesteuert wird und Aktionen ausführt.
- Agent Memory:
Speichersystem für einen LLM-Agenten, um vergangene Interaktionen zu nutzen.
- Agent Planning:
Strategie, mit der LLM-Agenten langfristige Aktionen planen.
- Function Calling:
Prozess, bei dem ein LLM externe Funktionen oder APIs zur Verarbeitung von Aufgaben aufruft.
LLM-Lingo: Enterprise Ready LLMs¶
- LLM Bias:
Verzerrungen in der Modellvorhersage aufgrund von Trainingsdaten.
- XAI (Explainable AI):
Techniken zur Nachvollziehbarkeit und Erklärung von KI-Modellen.
- Responsible AI:
Ethik und Sicherheit im KI-Einsatz, um Fairness und Transparenz sicherzustellen.
- AI Governance:
Richtlinien und Prozesse zur Überwachung und Regulierung von KI-Systemen.
- Compliance:
Einhaltung gesetzlicher Vorgaben für den KI-Einsatz.
- GDPR (General Data Protection Regulation):
Europäische Datenschutzverordnung zur Regulierung personenbezogener Daten.
- Alignment:
Abstimmung von KI-Modellen mit menschlichen Werten und Sicherheitsrichtlinien.
- Model Ethics:
Ethikrichtlinien zur Vermeidung von Diskriminierung und Missbrauch durch KI.
- PII (Personally Identifiable Information):
Daten, die eine Person eindeutig identifizieren können.
- LLMOps:
Operationalisierung und Wartung von LLMs in produktiven Umgebungen.
LLM-Lingo: LLM Vulnerabilities and Attacks¶
- Adversarial Attacks:
Gezielte Angriffe zur Manipulation von KI-Modellen.
- Black-Box Attacks:
Angriffe auf Modelle ohne direkten Zugriff auf deren interne Strukturen.
- White-Box Attacks:
Angriffe mit vollständigem Wissen über das Zielmodell.
- Vulnerability:
Schwachstellen in KI-Modellen, die ausgenutzt werden können.
- Deep Fakes:
Manipulierte Bilder oder Videos, die durch generative KI erstellt wurden.
- Jailbreaking:
Umgehung von Sicherheitsmechanismen eines KI-Modells.
- Prompt Injection:
Manipulation eines LLMs durch gezielte Eingaben, um unerwünschte Antworten zu erzeugen.
- Prompt Leaking:
Ungewollte Offenlegung interner Modellinformationen durch spezielle Eingaben.
- Red-Teaming:
Sicherheitsprüfung eines KI-Systems durch gezielte Tests auf Schwachstellen.
- Robustness:
Widerstandsfähigkeit eines Modells gegenüber Angriffen oder fehlerhaften Eingaben.
- Watermarking:
Techniken zur Kennzeichnung von KI-generierten Inhalten.
Learning Paradigms¶
- Unsupervised Learning:
Lernen aus nicht gekennzeichneten Daten ohne direkte Vorgaben.
- Supervised Learning:
Lernen aus gekennzeichneten Daten mit definierten Zielwerten.
- Reinforcement Learning:
Lernen durch Belohnungen und Bestrafungen in einer Umgebung.
- Meta-Learning:
Lernen, wie man effizient neue Aufgaben erlernen kann.
- Multi-Task Learning:
Training eines Modells auf mehrere Aufgaben gleichzeitig.
- Zero-Shot Learning:
Fähigkeit eines Modells, neue Aufgaben ohne vorheriges Training zu lösen.
- Few-Shot Learning:
Lernen aus wenigen Beispielen zur Lösung neuer Aufgaben.
- Online Learning:
Kontinuierliches Training eines Modells mit neuen Daten.
- Continual Learning:
Fähigkeit eines Modells, Wissen über Zeit zu behalten und zu erweitern.
- Federated Learning:
Dezentrale Modelloptimierung über mehrere Datenquellen ohne direkte Datenweitergabe.
- Adversarial Learning:
Training eines Modells mit simulierten Angriffen zur Robustheitssteigerung.
- Active Learning:
Modell kann gezielt Daten zur Verbesserung anfordern.