Höhlenmensch vs 'Sei kurz' Prompt: Benchmarking von Komprimierungs-Prompts für Claude

✍️ OpenClawRadar📅 Veröffentlicht: 29. April 2026🔗 Source
Höhlenmensch vs 'Sei kurz' Prompt: Benchmarking von Komprimierungs-Prompts für Claude
Ad

Ein Entwickler hat caveman (den populären Kurzschreib-Komprimierungs-Prompt) mit dem einfachen Prompt „be brief.“ verglichen, um zu sehen, ob die zusätzliche Komplexität sich tatsächlich auszahlt. Der Test führte 24 Entwicklungs-Prompts in 6 Kategorien durch und verglich 5 Arme: Baseline, „be brief.“, caveman lite, caveman full und caveman ultra. Die Ausgaben wurden von einer separaten Claude-Instanz anhand von pro Prompt erstellten Bewertungskriterien beurteilt.

Ad

Benchmark-Ergebnisse

  • Baseline: Durchschnittswert 0,985, durchschnittliche Token 636
  • „be brief.“: Durchschnittswert 0,985, durchschnittliche Token 419
  • Caveman lite: Durchschnittswert 0,976, durchschnittliche Token 401
  • Caveman full: Durchschnittswert 0,975, durchschnittliche Token 404
  • Caveman ultra: Durchschnittswert 0,970, durchschnittliche Token 449

Die Zwei-Wort-Version war caveman sowohl in der Kompression als auch in der Qualität ebenbürtig. Der Wert von caveman liegt jedoch woanders: konsistente Ausgabestruktur, Moduswechsel und der Sicherheits-Escape bei destruktiven Operationen. Der Sicherheits-Escape führte tatsächlich zu erheblichen Schwankungen in der Ausgabequalität, was für bestimmte Anwendungsfälle ein Problem darstellen könnte.

Eine vollständige Aufschlüsselung mit Daten pro Kategorie und Varianz-Erkenntnissen zu Sicherheitsfragen ist auf der Website des Autors verfügbar. Der Benchmark-Harness ist auf GitHub quelloffen.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

OpenClaw 2026.3.13-Regression verursacht falsche Meldungen über nicht erreichbare Status.
Nachrichten

OpenClaw 2026.3.13-Regression verursacht falsche Meldungen über nicht erreichbare Status.

OpenClaw Version 2026.3.13 führte eine diagnostische Regression ein, bei der Statusbefehle fälschlicherweise unerreichbare Gateways melden, obwohl RPC-Tests korrekt funktionieren. Ein Rollback auf 2026.3.12 behebt das Problem.

OpenClawRadar
YouTube Auto-Labels für KI-Videos: Vereinfachte Labels & automatische Erkennung im Jahr 2026
Nachrichten

YouTube Auto-Labels für KI-Videos: Vereinfachte Labels & automatische Erkennung im Jahr 2026

YouTube aktualisiert KI-Kennzeichnungen: prominenter platziert, automatische Erkennung von fotorealistischen KI-Inhalten und dauerhafte Kennzeichnungen für Videos, die mit YouTubes eigenen KI-Tools oder C2PA-Metadaten erstellt wurden.

OpenClawRadar
Microsoft veröffentlicht Phi-4-reasoning-vision-15B multimodales Modell mit Trainingserkenntnissen
Nachrichten

Microsoft veröffentlicht Phi-4-reasoning-vision-15B multimodales Modell mit Trainingserkenntnissen

Microsoft Research hat Phi-4-reasoning-vision-15B veröffentlicht, ein offenes multimodales Reasoning-Modell mit 15 Milliarden Parametern, das über Microsoft Foundry, HuggingFace und GitHub verfügbar ist. Das Modell vereint Reasoning-Leistung mit Effizienz und überzeugt insbesondere bei mathematisch-naturwissenschaftlichen Reasoning-Aufgaben und beim Verständnis von Benutzeroberflächen.

OpenClawRadar
Adaptive Inferenz-Routing-Vorschlag für KI-Abfrageeffizienz
Nachrichten

Adaptive Inferenz-Routing-Vorschlag für KI-Abfrageeffizienz

Ein im April 2026 bei Anthropic eingereichter Vorschlag skizziert ein fünfstufiges System zur Weiterleitung von Anfragen an geeignete KI-Modelle basierend auf einem Komplexitäts-Scoring, das einfache Signale wie Zeichenanzahl und Satzanzahl nutzt, bevor überhaupt eine Modellinferenz stattfindet.

OpenClawRadar