Das Prinzip In-Context-Learning
Few-Shot Learning ist eine Form des sogenannten In-Context-Learnings. Statt ein Modell durch erneutes Training auf eine Aufgabe anzupassen, stellt man die nötige Anleitung direkt in den Prompt. Ein typischer Few-Shot-Prompt enthält mehrere Eingabe-Ausgabe-Paare als Beispiele, gefolgt von der eigentlichen, noch unbeantworteten Eingabe. Das Modell erkennt das Muster und vervollständigt es konsistent.
Der Begriff stammt aus der Beobachtung, dass große Sprachmodelle erstaunlich gut darin sind, aus nur wenigen Demonstrationen zu generalisieren. Wo ältere Verfahren tausende annotierte Datenpunkte benötigten, genügen hier oft eine Handvoll gut gewählter Beispiele, um Format und Stil der Antwort verlässlich festzulegen.
Entscheidend ist, dass dieses Lernen flüchtig ist: Es gilt nur für den aktuellen Aufruf und verschwindet danach. Beim nächsten Prompt muss das Modell die Beispiele erneut sehen. Das unterscheidet Few-Shot Learning grundlegend vom Fine-Tuning, bei dem das gelernte Verhalten dauerhaft in den Gewichten verankert wird.
Zero-Shot, One-Shot und Few-Shot im Vergleich
Je nach Anzahl der mitgelieferten Beispiele unterscheidet man drei Stufen. Beim Zero-Shot-Prompting erhält das Modell nur die Anweisung ohne Beispiel. Beim One-Shot-Prompting kommt genau ein Beispiel hinzu, beim Few-Shot-Prompting mehrere. Mehr Beispiele helfen besonders dann, wenn das gewünschte Format ungewöhnlich ist oder die Aufgabe Feinheiten enthält, die sich schwer in Worten beschreiben lassen.
Die folgende Tabelle stellt die drei Varianten gegenüber. Als Faustregel gilt: Je klarer und gängiger die Aufgabe, desto eher reicht Zero-Shot; je spezifischer Format oder Tonalität sein müssen, desto mehr lohnen sich Beispiele. Allerdings verbrauchen Beispiele Platz im Kontextfenster und erhöhen die Kosten pro Anfrage.
In der Praxis ist Few-Shot Learning ein zentrales Werkzeug des Prompt-Engineerings. Es überbrückt die Lücke zwischen einer reinen Anweisung und einem vollständig trainierten Spezialmodell und liefert bei vielen Aufgaben bereits sehr gute Ergebnisse, ohne dass eigene Trainingsdaten oder Infrastruktur nötig wären.
Ein anschauliches Beispiel ist die Klassifikation von Kundennachrichten in Kategorien wie Reklamation, Anfrage oder Lob. Zeigt man dem Modell für jede Kategorie ein oder zwei typische Nachrichten samt korrekter Einordnung, ordnet es neue Nachrichten anschließend deutlich treffsicherer ein, als wenn es nur die Kategorienamen ohne Beispiel kennt. Genau diese Demonstration des gewünschten Verhaltens ist der Kern des Few-Shot-Prinzips.
| Variante | Beispiele im Prompt | Wann nutzen |
|---|---|---|
| Zero-Shot | keine | Klare, gängige Aufgaben mit eindeutiger Anweisung |
| One-Shot | genau eines | Wenn das gewünschte Format an einem Muster gezeigt werden muss |
| Few-Shot | mehrere (z. B. 2 bis 5) | Spezielle Formate, Tonalität oder feine Unterscheidungen |
| Many-Shot | viele (Dutzende) | Schwierige Muster, wenn das Kontextfenster es zulässt |
Gute Beispiele auswählen
Die Qualität eines Few-Shot-Prompts steht und fällt mit der Auswahl der Beispiele. Sie sollten repräsentativ für die echten Eingaben sein, das gewünschte Ausgabeformat exakt vorleben und untereinander konsistent sein. Widersprüchliche oder schlecht formatierte Beispiele verwirren das Modell mehr, als dass sie helfen.
Auch die Reihenfolge und Vielfalt der Beispiele spielen eine Rolle. Deckt man verschiedene typische Fälle ab – etwa unterschiedliche Eingabelängen oder Sonderfälle – generalisiert das Modell robuster. Bei Klassifikationsaufgaben empfiehlt es sich, die vorkommenden Kategorien ausgewogen zu zeigen, damit das Modell keine Klasse bevorzugt.
Schließlich gilt es, die Balance zwischen Nutzen und Kosten zu halten. Jedes Beispiel verbraucht Tokens und damit Kontextfenster und Rechenbudget. Mehr Beispiele bringen oft schnell abnehmenden Zusatznutzen, weshalb man die kleinste Menge wählen sollte, mit der die Ergebnisse zuverlässig stimmen.
- 1Aufgabe klar formulieren und gewünschtes Ausgabeformat festlegen
- 2Zwei bis fünf repräsentative Eingabe-Ausgabe-Paare als Beispiele zusammenstellen
- 3Beispiele auf konsistentes Format und Ausgewogenheit der Fälle prüfen
- 4Eigentliche Eingabe anhängen und Ergebnis bewerten
- 5Beispielmenge schrittweise reduzieren, solange die Qualität stabil bleibt
Grenzen und Alternativen
Few-Shot Learning ist mächtig, aber nicht für alles geeignet. Beispiele belegen Platz im Kontextfenster, der dann für die eigentliche Eingabe fehlt. Bei sehr langen Eingaben oder vielen benötigten Beispielen stößt die Methode an Grenzen, und die Kosten pro Anfrage steigen spürbar.
Wenn dieselbe Aufgabe in großem Volumen und stets gleichbleibend gelöst werden muss, kann Fine-Tuning langfristig günstiger und zuverlässiger sein, weil das Verhalten dann ohne Beispiele im Modell verankert ist. Für faktenintensive Aufgaben wiederum ist häufig eine Kombination mit Retrieval, also dem gezielten Einspeisen von Wissen, der bessere Weg.
In vielen realen KI-Lösungen wird Few-Shot Learning daher mit anderen Techniken kombiniert: ein klarer System-Prompt für die Rolle, einige Beispiele für das Format und gegebenenfalls abgerufener Kontext für die Fakten. Diese Schichtung liefert oft die beste Mischung aus Steuerbarkeit, Genauigkeit und Aufwand.
Häufige Fragen
Was ist Few-Shot Learning einfach erklärt?
Few-Shot Learning bedeutet, einem Sprachmodell einige Beispiele für die gewünschte Aufgabe direkt im Prompt zu zeigen, bevor die eigentliche Eingabe kommt. Das Modell erkennt das Muster und löst die neue Aufgabe nach demselben Schema. Es wird dabei nichts neu trainiert; das Lernen geschieht nur für diesen einen Aufruf im Kontextfenster.
Wie viele Beispiele braucht Few-Shot Learning?
Eine feste Zahl gibt es nicht, häufig genügen zwei bis fünf gut gewählte Beispiele. Wichtiger als die Menge ist, dass die Beispiele repräsentativ, konsistent formatiert und ausgewogen sind. Man sollte mit wenigen starten und die Anzahl nur erhöhen, solange die Ergebnisse dadurch messbar besser werden.
Worin unterscheidet sich Few-Shot von Fine-Tuning?
Beim Few-Shot Learning bleiben die Modellgewichte unverändert; die Beispiele wirken nur im aktuellen Prompt und müssen bei jedem Aufruf erneut mitgegeben werden. Beim Fine-Tuning wird das Modell mit Trainingsdaten dauerhaft angepasst. Few-Shot ist schneller und datensparsam, Fine-Tuning lohnt sich bei großem, gleichbleibendem Volumen.
Wann sollte ich Few-Shot statt Zero-Shot nutzen?
Zero-Shot reicht oft für klare, gängige Aufgaben mit eindeutiger Anweisung. Few-Shot lohnt sich, wenn ein ungewöhnliches Ausgabeformat, eine bestimmte Tonalität oder feine Unterscheidungen gefragt sind, die sich schwer in Worten beschreiben lassen. Dann zeigen Beispiele das gewünschte Verhalten zuverlässiger als jede Anweisung.
Welche Nachteile hat Few-Shot Learning?
Beispiele belegen Platz im Kontextfenster und erhöhen die Kosten pro Anfrage, da sie zusätzliche Tokens verbrauchen. Bei sehr langen Eingaben oder vielen benötigten Beispielen stößt die Methode an Grenzen. Außerdem können schlecht gewählte oder widersprüchliche Beispiele die Ergebnisse verschlechtern statt verbessern.
Kann ich Few-Shot Learning mit anderen Techniken kombinieren?
Ja, das ist sogar üblich. In der Praxis wird Few-Shot häufig mit einem klaren System-Prompt für die Rolle und mit Retrieval für aktuelle Fakten kombiniert. Diese Schichtung verbindet Format-Steuerung über Beispiele mit Genauigkeit über abgerufenes Wissen und liefert oft bessere Ergebnisse als jede Einzeltechnik.
Verwandte Begriffe
Vorgehen, bei dem ein Sprachmodell eine Aufgabe allein anhand einer Anweisung löst, ohne dass im Prompt Beispiele gezeigt werden.
Prompt Engineering ist die Kunst, KI-Anweisungen so zu formulieren, dass Sprachmodelle bessere Ergebnisse liefern.
Wiederverwendbare Prompt-Vorlage mit Platzhaltern und Variablen als Baustein robuster LLM-Anwendungen.
Fine-Tuning ist das gezielte Nachtrainieren eines vortrainierten KI-Modells für einen Anwendungsfall.
Das Context Window ist die maximale Menge an Token, die ein Sprachmodell gleichzeitig berücksichtigen kann.
Chain of Thought ist eine Technik, bei der ein Sprachmodell Schritt für Schritt denkt, um Aufgaben besser zu lösen.
