LLMs geben trotz expliziter Anweisungen strukturierte Ausgaben preis

✍️ OpenClawRadar📅 Veröffentlicht: 14. April 2026🔗 Source
LLMs geben trotz expliziter Anweisungen strukturierte Ausgaben preis
Ad

Das Problem: LLM-Validierung gibt Erklärungen preis

Ein Entwickler, der ein Tool erstellt, das parallele API-Aufrufe an Claude durchführt und strukturierte Ausgaben pro Aufruf analysiert, stieß auf ein intermittierendes Problem. Jeder Aufruf gibt Inhalte innerhalb spezifischer Markierungen wie [COVER], [SLIDE 1], [CAPTION] usw. zurück. Ein zweiter LLM-Durchgang validiert die Ausgabe anhand von Regeln und schreibt alles um, was nicht den Vorgaben entspricht.

Die Validierungseingabeaufforderung weist explizit an: "geben Sie NUR den korrigierten Text im exakt gleichen Format zurück. Keine Kommentare. Keine Erklärungen. Keine Verstoßlisten."

Trotzdem gibt das Validierungsmodell gelegentlich seine Erklärungen vor dem korrigierten Inhalt aus. Beispiele umfassen: "Ich muss diesen Text auf Verstöße prüfen... Diese Sätze bilden ein dramatisches Paar, das rein zur Wirkung eingesetzt wird. Hier ist die Überarbeitung:" gefolgt vom tatsächlich korrigierten Text.

Folgewirkungen

Dieser Erklärungstext wird direkt an den Parser weitergegeben. Der Parser erwartet Inhalte, die bei [COVER] beginnen, erhält jedoch stattdessen Meta-Kommentare. Dies führt zu Feldverschiebungen in nachgelagerten Prozessen. In einem Fall landete der Erklärungstext des Validators in einem Bildaufforderungsfeld, weil der Parser die Erklärung als Hauptinhalt interpretierte und alles um einige Zeilen verschob.

Alleiniges Präzisieren der Eingabeaufforderung löste das Problem nicht. Explizitere Anweisungen, das Hinzufügen von "Ihre Ausgabe MUSS mit der ersten Inhaltsmarkierung beginnen" und "schließen Sie niemals Erklärungen ein" reduzierten die Häufigkeit, beseitigten es aber nicht. Das Modell ignoriert gelegentlich Anweisungen, insbesondere wenn es Verstöße zu beheben findet – es möchte seine Arbeitsweise zeigen.

Ad

Die Lösung: Zwei-Ebenen-Abwehr

Die funktionierende Lösung umfasste zwei Ebenen:

  • Ebene 1: Präzisierung der Eingabeaufforderung. Immer noch sinnvoll, weil sie die Problemhäufigkeit reduziert.
  • Ebene 2: Eine defensive Filterfunktion, die bei jeder Validierungsausgabe ausgeführt wird, bevor eine Analyse stattfindet. Für strukturierte Formate wird an der ersten erkannten Markierung verankert und alles davor verworfen. Für Klartextformate werden Zeilen entfernt, die bekannten Validatorkommentarmustern entsprechen (wie "Lassen Sie mich diesen Text prüfen" oder "Dies verstößt gegen die Vorgabe").

Die Reihenfolge "Filtern vor Analysieren" ist entscheidend. Jeder nachgelagerte Parser arbeitet mit bereits bereinigter Ausgabe. Dies vermeidet die Pflege von pro-Feld-Filterlogik oder das Bekämpfen neuer Erklärungsformate wie bei einem Whack-a-Mole-Spiel.

Implementierungsüberlegungen

Für Klartext-Filtermuster ist ein sorgfältiges Design erforderlich. Ein Regex, der "Dies ist ein Verstoß" erfasst, könnte auch "Dies ist ein häufiger Fehler" in legitimen Inhalten erfassen. Muster sollten so präzise sein, dass sie nur validatorspezifische Sprache erfassen, wie "Dies verstößt gegen die/eine Regel/Vorgabe" statt breiter Übereinstimmungen mit "Dies ist" oder "Dies verwendet". Jedes Muster muss vor dem Einsatz an echten Inhalten überprüft werden.

Wenn Sie strukturierte Ausgaben eines LLM analysieren, behandeln Sie Eingabeaufforderungsanweisungen als ersten bestmöglichen Durchgang und haben Sie immer eine codebasierte Abwehr vor dem Parser. Das Modell wird in 95 % der Fälle folgen, aber die 5 %, in denen es das nicht tut, werden nachgelagerte Logik auf schwer reproduzierbare Weise brechen, weil sie intermittierend auftreten.

📖 Den vollständigen Quelltext lesen: r/ClaudeAI

Ad

👀 Siehe auch

Open-Source Agent OS: Rust-basiertes Betriebssystem für KI-Agenten mit WASM-Sandboxing und Hands-Funktion
Werkzeuge

Open-Source Agent OS: Rust-basiertes Betriebssystem für KI-Agenten mit WASM-Sandboxing und Hands-Funktion

Ein Open-Source-Betriebssystem für KI-Agenten wurde veröffentlicht, das 137.000 Zeilen Rust-Code unter MIT-Lizenz enthält. Das System führt Agenten in WASM-Sandboxen mit 16 Sicherheitsebenen aus und führt 'Hands' für geplante, autonome Agentenoperationen ein.

OpenClawRadar
Open-Source-System für ein zweites Gehirn, basierend auf Claude Code, für Aufgabenmanagement
Werkzeuge

Open-Source-System für ein zweites Gehirn, basierend auf Claude Code, für Aufgabenmanagement

Ein Open-Source-System namens Kipi System nutzt Claude Code, um offene Threads zu verfolgen, Nachverfolgungen zu entwerfen und Aufgaben zu verwalten, indem es Daten aus Kalender, E-Mail, CRM und Social-Feeds abruft. Es erzeugt eine tägliche HTML-Datei mit vorgefertigten Aktionen, sortiert nach Aufwand.

OpenClawRadar
Tinte: Eine Bereitstellungsplattform, bei der Claude-KI-Agenten die Hauptnutzer sind
Werkzeuge

Tinte: Eine Bereitstellungsplattform, bei der Claude-KI-Agenten die Hauptnutzer sind

Ink (ml.ink) ist eine Bereitstellungsplattform, die für KI-Agenten wie Claude entwickelt wurde und eine einzige Tool-Aufruf-Bereitstellung, automatische Framework-Erkennung sowie integrierte Dienste wie Rechenleistung, Datenbanken, DNS, Geheimnisse, Domains, Metriken und Protokolle bietet.

OpenClawRadar
ClawDeckX: Open-Source Web-Plattform im macOS-Stil zur Verwaltung von OpenClaw-Agenten
Werkzeuge

ClawDeckX: Open-Source Web-Plattform im macOS-Stil zur Verwaltung von OpenClaw-Agenten

ClawDeckX ist eine Open-Source-Webplattform zum Installieren, Konfigurieren und Überwachen von OpenClaw-Agenten. Sie bietet visuelle Verwaltungswerkzeuge, Echtzeitüberwachung und unterstützt 13 Sprachen.

OpenClawRadar