Fable 5 in Claude Code: Kostenanalyse des ersten Tages — 210 Dollar API-Äquivalent, 0 Dollar bezahlt

Ein Entwickler auf r/ClaudeAI stellte sein Claude-Code-Standardmodell am Starttag auf claude-fable-5 um und verfolgte die gesamte Nutzung des Tages mit den integrierten Sitzungsprotokollen von Claude Code. Die Ergebnisse: 742 Fable-Antworten in 5 Sitzungen, mit API-äquivalenten Kosten von 210,15 $ – aber tatsächlich 0,00 $ bezahlt, dank des Aktionszeitraums bis zum 22. Juni.
Methodik
Claude Code schreibt Sitzungsprotokolle als lokale JSONL-Dateien, einschließlich der Token-Nutzung pro Nachricht. Der Entwickler analysierte jede Fable-Nachricht in allen Projekten und bewertete sie zu den veröffentlichten API-Preisen:
- Eingabe-Tokens: 10 $ pro Million
- Ausgabe-Tokens: 50 $ pro Million
- Cache-Lesevorgänge: 0,1x des Basis-Eingabepreises (1 $ pro Million)
- Cache-Schreibvorgänge: 1,25x des Basis-Eingabepreises (12,50 $ pro Million)
Starttag-Gesamtzahlen
- 742 Fable-Antworten in 5 Sitzungen
- 77.885 Eingabe-Tokens / 938.211 Ausgabe-Tokens
- 124,3 Millionen Cache-Lese-Tokens, 3,0 Millionen Cache-Schreib-Tokens
- API-äquivalente Kosten: 210,15 $
- Tatsächliche Kosten: 0,00 $ (in kostenpflichtigen Plänen bis 22. Juni enthalten)
Die hohe Anzahl an Ausgabe-Tokens (938K gegenüber 78K Eingabe) ist typisch für die agentischen Schleifen von Claude Code – das Modell iteriert, generiert Code und überarbeitet. Cache-Lesevorgänge dominieren mit 124,3 Mio. Tokens, was auf effektives Prompt-Caching hinweist.
Praktische Erkenntnis
Wenn Sie einen kostenpflichtigen Plan haben, ist Fable 5 bis zum 22. Juni ohne Aufpreis verfügbar. Die API-äquivalenten Preise geben ein Gefühl für den Ressourcenverbrauch; die tatsächlichen Plankosten sind fest. Um diese Messung zu wiederholen, analysieren Sie die JSONL-Sitzungsprotokolle unter ~/.claude/sessions/.
📖 Vollständige Quelle lesen: r/ClaudeAI
👀 Siehe auch

SuperHQ: Führe KI-Codierungsagenten in isolierten MicroVM-Sandboxen aus
SuperHQ ist eine quelloffene Rust/GPUI-App, die KI-Coding-Agenten (Claude Code, OpenAI Codex, Pi) in isolierten MicroVM-Sandboxes ausführt. Jeder Agent erhält eine vollständige Debian-VM, mountet Projektverzeichnisse schreibgeschützt und hat nie Zugriff auf Host-API-Schlüssel – diese werden über einen Auth-Gateway-Proxy injiziert.

Die Double-Buffering-Technik für LLM-Kontextfenster eliminiert Stop-the-World-Kompaktierung
Eine Technik namens Double-Buffering kann verhindern, dass LLM-Agenten während der Kontextfensterkomprimierung einfrieren, indem sie frühzeitig zusammenfassen und zwei Puffer beibehalten, was einen nahtlosen Übergang ohne zusätzliche Inferenzkosten ermöglicht.

GoModel: Ein leichtgewichtiges Open-Source-AI-Gateway, geschrieben in Go
GoModel ist ein Open-Source-AI-Gateway, das eine einheitliche OpenAI-kompatible API für mehrere Anbieter bereitstellt, darunter OpenAI, Anthropic, Gemini, Groq, xAI und Ollama. Es zeichnet sich durch ein 17 MB großes Docker-Image aus, das 44-mal kleiner ist als LiteLLM, mit umgebungsvariablenbasierter Konfiguration und integrierter Beobachtbarkeit.

HN SOTA: Verfolgung der Beliebtheit von Codierungsmodellen durch Hacker News-Kommentare
HN SOTA ist eine täglich aktualisierte Pipeline, die Hacker News-Kommentare scannt, Gemini verwendet, um Codierungsmodelle aus der OpenRouter-Liste zu identifizieren, und die Stimmung pro Erwähnung in einem öffentlichen Google Sheet protokolliert. Die Top-10-Modelle nach Erwähnungen über ein gleitendes 10-Tage-Fenster werden angezeigt.