Claude Code über Ollama: Rechnung um ~90% senken

Dieses Repository von Coherence Daddy bietet eine komplette Einrichtung, um Claude Code-Terminalsitzungen über eine lokale Ollama-Instanz zu leiten, während Claude Desktop auf dem kostenpflichtigen Pro-Tarif von Anthropic bleibt. Das Ergebnis: eine behauptete ~90%ige Reduzierung der API-Kosten von Claude Code.

Wie es funktioniert

Sie betreiben zwei Engines parallel:

Claude Desktop (Anthropic) – genutzt für Strategie, Architektur, Code-Reviews und knifflige Fehler.
Claude Code → Ollama – genutzt für Lints, Refactorings, wiederholte Bearbeitungen, Batch-Dateioperationen und Grep-and-Replace-Aufgaben. Läuft auf einem kostenlosen Open-Source-Modell (Gemma, Qwen, DeepSeek, Ihrer Wahl).

Einrichtungsprozess

Das Repository enthält eine eigenständige HTML-Präsentation (21 Folien) mit einem Copy-Paste-Prompt, der ~98% der Einrichtung automatisch erledigt. Es erkennt automatisch Ihr Betriebssystem (macOS, Windows + WSL2, Linux), installiert alles, konfiguriert den Router und überprüft am Ende beide Engines.

Zur lokalen Ausführung:

git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html  # macOS, oder in Browser ziehen

Oder verwenden Sie direkt den Copy-Paste-Prompt aus prompts/copy-paste-prompt.md.

Repository-Struktur

prompts/copy-paste-prompt.md – der Einrichtungsprompt.
presentation/index.html – vollständiges visuelles Deck (kein Build-Schritt erforderlich).
Auch gehostet unter coherencedaddy.com/tutorials/use-ollama-to-enhance-claude.

Warum es das gibt

Claude Pro auf dem Desktop ist großartig für Denkarbeit und Architektur, aber Claude Code im Terminal verbraucht bei kontextintensiven Aufgaben schnell das Kontingent. Die Weiterleitung dieser Aufgaben über Ollama (lokal oder gehostete kostenlose Modelle) behält das gleiche Benutzererlebnis bei, jedoch zu einem Bruchteil der Kosten.