Halluzinationen bei Claude um 50% reduzieren: Pre-Output Prompt Injection

Ein Reddit-Nutzer hat eine Technik geteilt, um Halluzinationen in Claude AI durch Vorausgabe-Prompt-Injektion um etwa die Hälfte zu reduzieren. Die Methode konzentriert sich darauf, das Modell zu zwingen, vor der Generierung von Antworten eine interne Überprüfung durchzuführen.

Implementierungsdetails

Der Ansatz erfordert zwei spezifische Änderungen:

1. System-Prompt-Ergänzung

Fügen Sie diesen Markdown-Block zum System-Prompt von Claude hinzu (Ausgabestil):

Vor der Antwort WICHTIG: MUSS vor der Antwort auf den Nutzer ausgeführt werden, einschließlich Folgefragen. KEINE AUSNAHMEN. python -m pre_output.record '{ "turn": 1/2/..., "summary": "10 words max", "uncertainties": ["unresolved observations, unverified assumptions", ...], "possible-next-steps": ["refactor, update docs", ...] }'

Es ist NICHT falsch, nach dem Aufruf von pre_output.record zu entscheiden, dass Sie tatsächlich noch nicht bereit sind; in diesem Fall rufen Sie pre_output.record erneut mit aktualisierten Informationen auf.

2. Python-Skript-Erstellung

Erstellen Sie ein Python-Skript mit folgendem Inhalt:

print("recorded successfully.")
print("")
print("IMPORTANT RULES:")
print("- NEVER reply if you can make more progress autonomously.")
print("- NEVER reply if uncertainties remain. Do more verification.")
print("")

Wie es funktioniert

Das System zwingt Claude dazu:

Ein JSON-Objekt mit Turn-Nummer, kurzer Zusammenfassung (maximal 10 Wörter), Unsicherheitenliste und möglichen nächsten Schritten zu erfassen
Die Bereitschaft vor der Antwort neu zu bewerten
Strenge Regeln zu befolgen, nicht zu antworten, wenn Unsicherheiten bestehen oder wenn autonomer Fortschritt möglich ist

Die Technik scheint für Entwickler konzipiert zu sein, die Claude als Programmierassistent verwenden, insbesondere für komplexe Aufgaben, bei denen Überprüfung und schrittweise Argumentation entscheidend sind.

📖 Read the full source: r/ClaudeAI

Reduzierung von Halluzinationen bei Claude durch Pre-Output Prompt Injection

Implementierungsdetails

1. System-Prompt-Ergänzung

2. Python-Skript-Erstellung

Wie es funktioniert

👀 Siehe auch

OpenClaw Discord-Proxy-Fix für REST-API-Timeout-Probleme

Hohe CPU/RAM-Auslastung und Gateway-Neustarts in OpenClaw? IPv6 für Telegram deaktivieren

Praktische Strategien zur Vermeidung von Claude-Ratelimits beim $200-Max-Plan

Verifikations-Harness behebt Claude's Planausführungsproblem