Höhlenmensch vs 'Sei kurz' Prompt: Benchmarking von Komprimierungs-Prompts für Claude

Ein Entwickler hat caveman (den populären Kurzschreib-Komprimierungs-Prompt) mit dem einfachen Prompt „be brief.“ verglichen, um zu sehen, ob die zusätzliche Komplexität sich tatsächlich auszahlt. Der Test führte 24 Entwicklungs-Prompts in 6 Kategorien durch und verglich 5 Arme: Baseline, „be brief.“, caveman lite, caveman full und caveman ultra. Die Ausgaben wurden von einer separaten Claude-Instanz anhand von pro Prompt erstellten Bewertungskriterien beurteilt.
Benchmark-Ergebnisse
- Baseline: Durchschnittswert 0,985, durchschnittliche Token 636
- „be brief.“: Durchschnittswert 0,985, durchschnittliche Token 419
- Caveman lite: Durchschnittswert 0,976, durchschnittliche Token 401
- Caveman full: Durchschnittswert 0,975, durchschnittliche Token 404
- Caveman ultra: Durchschnittswert 0,970, durchschnittliche Token 449
Die Zwei-Wort-Version war caveman sowohl in der Kompression als auch in der Qualität ebenbürtig. Der Wert von caveman liegt jedoch woanders: konsistente Ausgabestruktur, Moduswechsel und der Sicherheits-Escape bei destruktiven Operationen. Der Sicherheits-Escape führte tatsächlich zu erheblichen Schwankungen in der Ausgabequalität, was für bestimmte Anwendungsfälle ein Problem darstellen könnte.
Eine vollständige Aufschlüsselung mit Daten pro Kategorie und Varianz-Erkenntnissen zu Sicherheitsfragen ist auf der Website des Autors verfügbar. Der Benchmark-Harness ist auf GitHub quelloffen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

OpenClaw 2026.3.13-Regression verursacht falsche Meldungen über nicht erreichbare Status.
OpenClaw Version 2026.3.13 führte eine diagnostische Regression ein, bei der Statusbefehle fälschlicherweise unerreichbare Gateways melden, obwohl RPC-Tests korrekt funktionieren. Ein Rollback auf 2026.3.12 behebt das Problem.

YouTube Auto-Labels für KI-Videos: Vereinfachte Labels & automatische Erkennung im Jahr 2026
YouTube aktualisiert KI-Kennzeichnungen: prominenter platziert, automatische Erkennung von fotorealistischen KI-Inhalten und dauerhafte Kennzeichnungen für Videos, die mit YouTubes eigenen KI-Tools oder C2PA-Metadaten erstellt wurden.

Microsoft veröffentlicht Phi-4-reasoning-vision-15B multimodales Modell mit Trainingserkenntnissen
Microsoft Research hat Phi-4-reasoning-vision-15B veröffentlicht, ein offenes multimodales Reasoning-Modell mit 15 Milliarden Parametern, das über Microsoft Foundry, HuggingFace und GitHub verfügbar ist. Das Modell vereint Reasoning-Leistung mit Effizienz und überzeugt insbesondere bei mathematisch-naturwissenschaftlichen Reasoning-Aufgaben und beim Verständnis von Benutzeroberflächen.

Adaptive Inferenz-Routing-Vorschlag für KI-Abfrageeffizienz
Ein im April 2026 bei Anthropic eingereichter Vorschlag skizziert ein fünfstufiges System zur Weiterleitung von Anfragen an geeignete KI-Modelle basierend auf einem Komplexitäts-Scoring, das einfache Signale wie Zeichenanzahl und Satzanzahl nutzt, bevor überhaupt eine Modellinferenz stattfindet.