Reduzierung von Halluzinationen bei Claude durch Pre-Output Prompt Injection

Ein Reddit-Nutzer hat eine Technik geteilt, um Halluzinationen in Claude AI durch Vorausgabe-Prompt-Injektion um etwa die Hälfte zu reduzieren. Die Methode konzentriert sich darauf, das Modell zu zwingen, vor der Generierung von Antworten eine interne Überprüfung durchzuführen.
Implementierungsdetails
Der Ansatz erfordert zwei spezifische Änderungen:
1. System-Prompt-Ergänzung
Fügen Sie diesen Markdown-Block zum System-Prompt von Claude hinzu (Ausgabestil):
Vor der Antwort
WICHTIG: MUSS vor der Antwort auf den Nutzer ausgeführt werden, einschließlich Folgefragen. KEINE AUSNAHMEN.
python -m pre_output.record '{ "turn": 1/2/..., "summary": "10 words max", "uncertainties": ["unresolved observations, unverified assumptions", ...], "possible-next-steps": ["refactor, update docs", ...] }'
Es ist NICHT falsch, nach dem Aufruf von pre_output.record zu entscheiden, dass Sie tatsächlich noch nicht bereit sind; in diesem Fall rufen Sie pre_output.record erneut mit aktualisierten Informationen auf.
2. Python-Skript-Erstellung
Erstellen Sie ein Python-Skript mit folgendem Inhalt:
print("recorded successfully.")
print("")
print("IMPORTANT RULES:")
print("- NEVER reply if you can make more progress autonomously.")
print("- NEVER reply if uncertainties remain. Do more verification.")
print(" ")Wie es funktioniert
Das System zwingt Claude dazu:
- Ein JSON-Objekt mit Turn-Nummer, kurzer Zusammenfassung (maximal 10 Wörter), Unsicherheitenliste und möglichen nächsten Schritten zu erfassen
- Die Bereitschaft vor der Antwort neu zu bewerten
- Strenge Regeln zu befolgen, nicht zu antworten, wenn Unsicherheiten bestehen oder wenn autonomer Fortschritt möglich ist
Die Technik scheint für Entwickler konzipiert zu sein, die Claude als Programmierassistent verwenden, insbesondere für komplexe Aufgaben, bei denen Überprüfung und schrittweise Argumentation entscheidend sind.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Verwendung des Dispatcher-Musters zur Senkung der Claude-API-Kosten um 95 %
Ein Entwickler reduzierte die Claude-API-Kosten von 800-2000 $/Monat auf 215 $/Monat, indem er ein Dispatcher-Muster implementierte, das schwere Aufgaben an die Claude Code CLI auf einem 200 $/Monat Max-Abonnement delegiert, wobei der API-Overhead nur 5-15 $/Monat kostet.

7 MCP Gateway Bugs: Session-Leaks, totes SSE und OAuth im Gateway-Modus
Ein Reddit-Beitrag beschreibt sieben reale MCP-Gateway-Bugs – Sitzungszustand, der zwischen Clients ausläuft, stille SSE-Trennungen, OAuth-Fehler im Gateway-Modus und mehr – mit Lösungen basierend auf langweiliger Infrastruktur, nicht auf besseren Prompts.

Vage Prompts sind das eigentliche Problem, nicht das Modell — 50-Durchlauftest zeigt, dass die Prompt-Qualität die Modellwahl übertrifft
Ein Reddit-Nutzer hat dieselben zehn Eingabeaufforderungen fünfmal durch ChatGPT 4, Claude Sonnet und Gemini 1.5 Pro laufen lassen (insgesamt 150 Ausgaben) und festgestellt, dass alle drei Modelle ähnlich brauchbare oder ähnlich generische Ergebnisse lieferten – der entscheidende Faktor war die Spezifität der Aufforderung, nicht das Modell.

Verbesserung von OpenClaw mit der Macht des lokalen LLM: Einführung von GLM-4.7-Flash
Die Integration von GLM-4.7-Flash mit OpenClaw revolutioniert die Automatisierung durch KI, indem sie eine nahtlose lokale Bereitstellung und ausgeklügelte Code-Ausführung ermöglicht.