LLM-Rat-Analyse enthüllt praktische Claude-Code-Token-Optimierungsstrategien

✍️ OpenClawRadar📅 Veröffentlicht: 14. April 2026🔗 Source

Problem und Experimentaufbau

Ein Entwickler, der täglich an die Nutzungslimits von Claude Code stieß, führte ein Experiment mit LLM Council (https://github.com/karpathy/llm-council) durch. Der Aufbau umfasste 5 verschiedene Personas, die gezwungen waren, Lösungen zu kritisieren, herauszufordern und zu verfeinern, gefolgt von einer Runde mit Peer-Review.

Wichtige Erkenntnisse

Die Analyse ergab, dass der größte Token-Verbrauch nicht durch Komplexität verursacht wurde, sondern durch die standardmäßige Nutzung des "Denkmodus". Allein dies verbrauchte Token fast wie Opus.

Praktische Optimierungsgewohnheiten

Erweitertes Denken standardmäßig AUSschalten
/clear nach jedem Git-Commit (nicht verhandelbar)
Aufhören, "Ja / Weiter"-Prompts zu schreiben
/compact etwa alle ~40 Nachrichten
CLAUDE.md schlank halten, sonst zahlt man Steuern jede Sitzung

Mentaler Wandel und Ergebnisse

Die zentrale Einsicht: Hören Sie auf, Intelligenz als Standard zu behandeln. Behandeln Sie sie wie eine Ressource, die Sie bewusst einsetzen. Dieser Wandel ermöglicht:

Sofortige 30-50%ige Token-Einsparungen
Die Möglichkeit, Opus tatsächlich ohne Angst zu nutzen
Vorhersehbaren täglichen Arbeitsablauf statt zufälliger Limit-Überschreitungen

Der Rat betonte eine Regel: Wenn Sie /cost nicht verfolgen, optimieren Sie nicht... Sie raten.

Ergebnis

Mit der vollständigen Implementierung des Playbooks:

~60-70%ige Reduktion des Token-Verbrauchs
Gleiche oder bessere Ausgabequalität
Opus wird für hochwertige Arbeit nutzbar

Der Entwickler stellte fest, dass dieser Ansatz effektiver war als jeder einzelne Prompt-Hack.

📖 Read the full source: r/ClaudeAI

👀 Siehe auch

Werkzeuge

TailClaude: Open-Source-Weboberfläche für den Zugriff auf Claude-Code-Sitzungen von Mobilgeräten und Browsern

TailClaude ist eine Open-Source-Weboberfläche, mit der Sie Claude-Code-Sitzungen von Ihrem Smartphone oder jedem Browser in weniger als einer Minute über Tailscale aufrufen und fortsetzen können. Das Projekt wurde mit Unterstützung von Claude Code für das Grundgerüst, das SSE-Streaming-Backend, die mobile Chat-Oberfläche und die QR-Code-Integration entwickelt.

24. Feb. 2026, 18:45 UTC

OpenClawRadar

Werkzeuge

Claude-Vorschlag: Scope-Speicher & hermetische Instanztrennung

Ein formeller Vorschlag an Anthropic von einem Power-User: globale/lokale Speicherbereiche und hermetische Instanzisolierung für Claude, die deterministische, überprüfbare Sitzungen ermöglicht.

8. Juli 2026, 12:16 UTC

OpenClawRadar

Werkzeuge

Open-Source GTM-Plugin für Claude Code mit 166 Marketing-Skills und Bootstrap-Befehl

Ein Entwickler hat ein Open-Source-Go-To-Market-Plugin für Claude Code veröffentlicht, das 166 spezialisierte Marketing-Fähigkeiten in den Bereichen SEO, Content, Outbound, Sales, Growth, Analytics, Strategie, Ads, Social, CRM und KI-Suche bietet. Das Plugin enthält einen /bootstrap-Befehl, der Nutzer zu ihrer Marke befragt, um personalisierte Kontextdateien zu generieren.

17. Apr. 2026, 12:45 UTC

OpenClawRadar

Werkzeuge

Benchmarking von Nemotron 3 Super 120B mit 1M Token-Kontext auf M1 Ultra

Ein Nutzer testete Nemotron 3 Super 120B mit einem Q4_K_M quantisierten Modell unter Verwendung von llama.cpp auf einem M1 Ultra und erreichte ein Kontextfenster von 1 Million Token, das etwa 90 GB VRAM verbrauchte. Leistungsbenchmarks zeigen Token-Generierungsgeschwindigkeiten von 255 t/s bei 512 Token Prompt-Verarbeitung bis hinab zu 22,37 t/s bei einem Kontext von 100.000 Token.

12. März 2026, 14:45 UTC

OpenClawRadar