Systemprompt-Optimierung: 200 vs 3.847 Token für Claude

Ein Nutzer auf r/ClaudeAI berichtete, dass er nach acht Monaten Kampf mit einem massiven 3.847 Wörter umfassenden System-Prompt – der Anforderungen, Codierungsstandards, Projektkontext, Persönlichkeitspräferenzen und Fehlerbehandlung abdeckte – die Ursache entdeckte: Der Prompt war zu lang.

Claude fing stark an, vergaß aber allmählich die Hälfte der Anweisungen oder ignorierte Teile, die nicht passten. Der Nutzer fragte Claude selbst, warum es ständig Anweisungen vergaß, und das Modell deutete an, dass die Prompts zu lang waren.

Die Lösung bestand darin, den einzelnen riesigen Prompt durch mehrere winzige, fokussierte Prompts zu ersetzen, insgesamt etwa 200 Wörter:

"Schreibe zuerst Tests. Verwende Jest. Deck Randfälle ab."
"Erkläre deine Codeänderungen in Stichpunkten."
"Frage, bevor du neue Abhängigkeiten installierst."

Nach drei Wochen Tests berichtet der Nutzer, dass Claude diese kurzen Prompts konsequent befolgt, Gespräche nicht mehr in zufällige Abschweifungen abdriften und die Token-Nutzung gesunken ist, da weniger überflüssiger Text verarbeitet werden muss. Bemerkenswerterweise gab es keine einzige Konversation, in der Claude unaufgefordert damit begann, die Codebasis zu refaktorisieren.

Die Erkenntnis: Kurze Prompts erzwingen Spezifität darüber, was man wirklich will, anstatt zu versuchen, jedes Szenario vorherzusehen, und Claude arbeitet besser, wenn ihm Raum zum Denken gegeben wird, anstatt einer Romans Länge an Einschränkungen.

📖 Read the full source: r/ClaudeAI

Kurze Systemprompts verbessern Claudes Compliance und reduzieren Token-Verschwendung

👀 Siehe auch

Model-Routing senkt API-Kosten um 85 % im Vergleich zum Claude Max Abonnement – Eine Entwickleranalyse

Claude Code Token-Verschwendung beheben: Deaktiviere Attribution-Header für bessere Cache-Treffer

Geh nicht davon aus, dass teure Modelle besser sind: Fallstudie zeigt 13-fache Kosteneinsparungen durch Tests

Hilfreiche Tipps aus der OpenClaw-Community: Ein vertiefter Einblick in die Optimierung von KI-Agenten