Fable 5 in Claude Code: Kostenanalyse des ersten Tages — 210 Dollar API-Äquivalent, 0 Dollar bezahlt

✍️ OpenClawRadar📅 Veröffentlicht: 11. Juni 2026🔗 Source

Ein Entwickler auf r/ClaudeAI stellte sein Claude-Code-Standardmodell am Starttag auf claude-fable-5 um und verfolgte die gesamte Nutzung des Tages mit den integrierten Sitzungsprotokollen von Claude Code. Die Ergebnisse: 742 Fable-Antworten in 5 Sitzungen, mit API-äquivalenten Kosten von 210,15 $ – aber tatsächlich 0,00 $ bezahlt, dank des Aktionszeitraums bis zum 22. Juni.

Methodik

Claude Code schreibt Sitzungsprotokolle als lokale JSONL-Dateien, einschließlich der Token-Nutzung pro Nachricht. Der Entwickler analysierte jede Fable-Nachricht in allen Projekten und bewertete sie zu den veröffentlichten API-Preisen:

Eingabe-Tokens: 10 $ pro Million
Ausgabe-Tokens: 50 $ pro Million
Cache-Lesevorgänge: 0,1x des Basis-Eingabepreises (1 $ pro Million)
Cache-Schreibvorgänge: 1,25x des Basis-Eingabepreises (12,50 $ pro Million)

Starttag-Gesamtzahlen

742 Fable-Antworten in 5 Sitzungen
77.885 Eingabe-Tokens / 938.211 Ausgabe-Tokens
124,3 Millionen Cache-Lese-Tokens, 3,0 Millionen Cache-Schreib-Tokens
API-äquivalente Kosten: 210,15 $
Tatsächliche Kosten: 0,00 $ (in kostenpflichtigen Plänen bis 22. Juni enthalten)

Die hohe Anzahl an Ausgabe-Tokens (938K gegenüber 78K Eingabe) ist typisch für die agentischen Schleifen von Claude Code – das Modell iteriert, generiert Code und überarbeitet. Cache-Lesevorgänge dominieren mit 124,3 Mio. Tokens, was auf effektives Prompt-Caching hinweist.

Praktische Erkenntnis

Wenn Sie einen kostenpflichtigen Plan haben, ist Fable 5 bis zum 22. Juni ohne Aufpreis verfügbar. Die API-äquivalenten Preise geben ein Gefühl für den Ressourcenverbrauch; die tatsächlichen Plankosten sind fest. Um diese Messung zu wiederholen, analysieren Sie die JSONL-Sitzungsprotokolle unter ~/.claude/sessions/.

📖 Vollständige Quelle lesen: r/ClaudeAI

👀 Siehe auch

Werkzeuge

SuperHQ: Führe KI-Codierungsagenten in isolierten MicroVM-Sandboxen aus

SuperHQ ist eine quelloffene Rust/GPUI-App, die KI-Coding-Agenten (Claude Code, OpenAI Codex, Pi) in isolierten MicroVM-Sandboxes ausführt. Jeder Agent erhält eine vollständige Debian-VM, mountet Projektverzeichnisse schreibgeschützt und hat nie Zugriff auf Host-API-Schlüssel – diese werden über einen Auth-Gateway-Proxy injiziert.

23. Apr. 2026, 18:16 UTC

OpenClawRadar

Werkzeuge

Die Double-Buffering-Technik für LLM-Kontextfenster eliminiert Stop-the-World-Kompaktierung

Eine Technik namens Double-Buffering kann verhindern, dass LLM-Agenten während der Kontextfensterkomprimierung einfrieren, indem sie frühzeitig zusammenfassen und zwei Puffer beibehalten, was einen nahtlosen Übergang ohne zusätzliche Inferenzkosten ermöglicht.

25. Feb. 2026, 07:45 UTC

OpenClawRadar

Werkzeuge

GoModel: Ein leichtgewichtiges Open-Source-AI-Gateway, geschrieben in Go

GoModel ist ein Open-Source-AI-Gateway, das eine einheitliche OpenAI-kompatible API für mehrere Anbieter bereitstellt, darunter OpenAI, Anthropic, Gemini, Groq, xAI und Ollama. Es zeichnet sich durch ein 17 MB großes Docker-Image aus, das 44-mal kleiner ist als LiteLLM, mit umgebungsvariablenbasierter Konfiguration und integrierter Beobachtbarkeit.

21. Apr. 2026, 16:19 UTC

OpenClawRadar

Werkzeuge

HN SOTA: Verfolgung der Beliebtheit von Codierungsmodellen durch Hacker News-Kommentare

HN SOTA ist eine täglich aktualisierte Pipeline, die Hacker News-Kommentare scannt, Gemini verwendet, um Codierungsmodelle aus der OpenRouter-Liste zu identifizieren, und die Stimmung pro Erwähnung in einem öffentlichen Google Sheet protokolliert. Die Top-10-Modelle nach Erwähnungen über ein gleitendes 10-Tage-Fenster werden angezeigt.

3. Mai 2026, 02:17 UTC

OpenClawRadar