Kurze Systemprompts verbessern Claudes Compliance und reduzieren Token-Verschwendung

Ein Nutzer auf r/ClaudeAI berichtete, dass er nach acht Monaten Kampf mit einem massiven 3.847 Wörter umfassenden System-Prompt – der Anforderungen, Codierungsstandards, Projektkontext, Persönlichkeitspräferenzen und Fehlerbehandlung abdeckte – die Ursache entdeckte: Der Prompt war zu lang.
Claude fing stark an, vergaß aber allmählich die Hälfte der Anweisungen oder ignorierte Teile, die nicht passten. Der Nutzer fragte Claude selbst, warum es ständig Anweisungen vergaß, und das Modell deutete an, dass die Prompts zu lang waren.
Die Lösung bestand darin, den einzelnen riesigen Prompt durch mehrere winzige, fokussierte Prompts zu ersetzen, insgesamt etwa 200 Wörter:
"Schreibe zuerst Tests. Verwende Jest. Deck Randfälle ab.""Erkläre deine Codeänderungen in Stichpunkten.""Frage, bevor du neue Abhängigkeiten installierst."
Nach drei Wochen Tests berichtet der Nutzer, dass Claude diese kurzen Prompts konsequent befolgt, Gespräche nicht mehr in zufällige Abschweifungen abdriften und die Token-Nutzung gesunken ist, da weniger überflüssiger Text verarbeitet werden muss. Bemerkenswerterweise gab es keine einzige Konversation, in der Claude unaufgefordert damit begann, die Codebasis zu refaktorisieren.
Die Erkenntnis: Kurze Prompts erzwingen Spezifität darüber, was man wirklich will, anstatt zu versuchen, jedes Szenario vorherzusehen, und Claude arbeitet besser, wenn ihm Raum zum Denken gegeben wird, anstatt einer Romans Länge an Einschränkungen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Auth 400 Fehlerbehebung: Verwendung des Python-Pakets `mnemonic`, um BIP39-Filterauslöser zu vermeiden
Ein Reddit-Nutzer stellte fest, dass der Inhaltsfilter von Anthropic einen 400-Fehler auslöst, wenn KI-Agenten versuchen, die vollständige BIP39-Wortliste (2048 standardisierte englische Wörter) in Python-Code zu schreiben. Die Lösung besteht darin, stattdessen das Python-Paket 'mnemonic' zu verwenden, das die Wortliste intern enthält.

MiniMax M2.7 Q8_0 128K auf 2x3090 mit CPU-Offloading – Benchmarks und Konfiguration aus der Praxis
Ein Benutzer führt erfolgreich MiniMax M2.7 mit Q8_0 und 128K Kontext auf zwei RTX 3090 plus DDR4 RAM aus, erreicht ~50 tps Prompt-Verarbeitung und ~10 tps Token-Generierung und teilt seine llama-Server-Flags.

OpenClaw-Agenten werden nach Woche 1 reaktionslos: Probleme mit der Telegram-Integration?
Benutzer berichten, dass OpenClaw-Agenten nach der ersten Woche verstummen, und vermuten Probleme mit der Telegram-Integration oder der Langzeitlaufzeit. Neustarts helfen vorübergehend.

Pro KI-Agent-Dummheit beheben: Ein gemeinsamer Kontextbaum pro Repository
Der Grund, warum KI-Mitarbeiter sich dumm anfühlen, ist nicht das Modell – es ist der Mangel an gemeinsamem Kontext. Die Lösung eines Entwicklers: ein Kontextbaum-Repository mit hierarchischen Markdown-Knoten, die der Agent automatisch pflegt.