Claude Code über Ollama leiten und Ihre Rechnung um ~90% senken

Dieses Repository von Coherence Daddy bietet eine komplette Einrichtung, um Claude Code-Terminalsitzungen über eine lokale Ollama-Instanz zu leiten, während Claude Desktop auf dem kostenpflichtigen Pro-Tarif von Anthropic bleibt. Das Ergebnis: eine behauptete ~90%ige Reduzierung der API-Kosten von Claude Code.
Wie es funktioniert
Sie betreiben zwei Engines parallel:
- Claude Desktop (Anthropic) – genutzt für Strategie, Architektur, Code-Reviews und knifflige Fehler.
- Claude Code → Ollama – genutzt für Lints, Refactorings, wiederholte Bearbeitungen, Batch-Dateioperationen und Grep-and-Replace-Aufgaben. Läuft auf einem kostenlosen Open-Source-Modell (Gemma, Qwen, DeepSeek, Ihrer Wahl).
Einrichtungsprozess
Das Repository enthält eine eigenständige HTML-Präsentation (21 Folien) mit einem Copy-Paste-Prompt, der ~98% der Einrichtung automatisch erledigt. Es erkennt automatisch Ihr Betriebssystem (macOS, Windows + WSL2, Linux), installiert alles, konfiguriert den Router und überprüft am Ende beide Engines.
Zur lokalen Ausführung:
git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html # macOS, oder in Browser ziehenOder verwenden Sie direkt den Copy-Paste-Prompt aus prompts/copy-paste-prompt.md.
Repository-Struktur
prompts/copy-paste-prompt.md– der Einrichtungsprompt.presentation/index.html– vollständiges visuelles Deck (kein Build-Schritt erforderlich).- Auch gehostet unter coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.
Warum es das gibt
Claude Pro auf dem Desktop ist großartig für Denkarbeit und Architektur, aber Claude Code im Terminal verbraucht bei kontextintensiven Aufgaben schnell das Kontingent. Die Weiterleitung dieser Aufgaben über Ollama (lokal oder gehostete kostenlose Modelle) behält das gleiche Benutzererlebnis bei, jedoch zu einem Bruchteil der Kosten.
Lizenz
MIT – frei zur Nutzung, zum Forken oder Remixen.
📖 Lesen Sie die vollständige Quelle: HN AI Agents
👀 Siehe auch

Implementierung von Zeitverfolgung in Claude AI-Projekten
Eine Methode, die Claude AI verwendet, umfasst das Zeitstempeln von Antworten, um Arbeitssitzungen zu verfolgen und Pausenbeschränkungen zu senden.

Praktische Einrichtungs- und Konfigurationsanleitung für den selbst gehosteten OpenClaw KI-Agenten
OpenClaw ist ein selbst gehosteter KI-Agent, der sich in Messaging-Apps integriert und über ein dateibasiertes System ein dauerhaftes Gedächtnis bewahrt. Wichtige Einrichtungsempfehlungen umfassen: mit der Terminaloberfläche beginnen, zunächst nur einen Messaging-Kanal verbinden und die SOUL.md-Datei korrekt für Persönlichkeit und Sicherheitsregeln konfigurieren.

Claude Code Workflow Visual erklärt Speicherhierarchie und Fähigkeitensystem
Ein Reddit-Nutzer teilte ein visuelles Diagramm, das die Arbeitsablaufstruktur von Claude Code zeigt, einschließlich der Speicherschichtung mit CLAUDE.md-Dateien und wiederverwendbaren Fähigkeiten, die in .claude/skills/-Verzeichnissen definiert sind. Der Arbeitsablaufkreis schlägt vor, den Planmodus zu nutzen, Funktionen zu beschreiben, automatisch zu akzeptieren und häufig zu committen.

Behebung der KV-Cache-Invalidierung von Claude Code mit lokalen Backends
Claude Code Versionen 2.1.36+ fügen dynamische Telemetrie-Header und Git-Status-Updates in jede Anfrage ein, was Präfix-Matching unterbricht und eine vollständige Neuverarbeitung von Systemprompts mit 20K+ Token auf lokalen Backends wie llama.cpp erzwingt. Eine Konfigurationskorrektur in ~/.claude/settings.json kann die Verarbeitungszeit von 60+ Sekunden auf etwa 4 Sekunden reduzieren.