Claude Code über Ollama leiten und Ihre Rechnung um ~90% senken

✍️ OpenClawRadar📅 Veröffentlicht: 27. April 2026🔗 Source
Claude Code über Ollama leiten und Ihre Rechnung um ~90% senken
Ad

Dieses Repository von Coherence Daddy bietet eine komplette Einrichtung, um Claude Code-Terminalsitzungen über eine lokale Ollama-Instanz zu leiten, während Claude Desktop auf dem kostenpflichtigen Pro-Tarif von Anthropic bleibt. Das Ergebnis: eine behauptete ~90%ige Reduzierung der API-Kosten von Claude Code.

Wie es funktioniert

Sie betreiben zwei Engines parallel:

  • Claude Desktop (Anthropic) – genutzt für Strategie, Architektur, Code-Reviews und knifflige Fehler.
  • Claude Code → Ollama – genutzt für Lints, Refactorings, wiederholte Bearbeitungen, Batch-Dateioperationen und Grep-and-Replace-Aufgaben. Läuft auf einem kostenlosen Open-Source-Modell (Gemma, Qwen, DeepSeek, Ihrer Wahl).

Einrichtungsprozess

Das Repository enthält eine eigenständige HTML-Präsentation (21 Folien) mit einem Copy-Paste-Prompt, der ~98% der Einrichtung automatisch erledigt. Es erkennt automatisch Ihr Betriebssystem (macOS, Windows + WSL2, Linux), installiert alles, konfiguriert den Router und überprüft am Ende beide Engines.

Zur lokalen Ausführung:

git clone https://github.com/Coherence-Daddy/use-ollama-to-enhance-claude.git
cd use-ollama-to-enhance-claude/presentation
open index.html  # macOS, oder in Browser ziehen

Oder verwenden Sie direkt den Copy-Paste-Prompt aus prompts/copy-paste-prompt.md.

Ad

Repository-Struktur

Warum es das gibt

Claude Pro auf dem Desktop ist großartig für Denkarbeit und Architektur, aber Claude Code im Terminal verbraucht bei kontextintensiven Aufgaben schnell das Kontingent. Die Weiterleitung dieser Aufgaben über Ollama (lokal oder gehostete kostenlose Modelle) behält das gleiche Benutzererlebnis bei, jedoch zu einem Bruchteil der Kosten.

Lizenz

MIT – frei zur Nutzung, zum Forken oder Remixen.

📖 Lesen Sie die vollständige Quelle: HN AI Agents

Ad

👀 Siehe auch

Implementierung von Zeitverfolgung in Claude AI-Projekten
Anleitungen

Implementierung von Zeitverfolgung in Claude AI-Projekten

Eine Methode, die Claude AI verwendet, umfasst das Zeitstempeln von Antworten, um Arbeitssitzungen zu verfolgen und Pausenbeschränkungen zu senden.

OpenClawRadar
Praktische Einrichtungs- und Konfigurationsanleitung für den selbst gehosteten OpenClaw KI-Agenten
Anleitungen

Praktische Einrichtungs- und Konfigurationsanleitung für den selbst gehosteten OpenClaw KI-Agenten

OpenClaw ist ein selbst gehosteter KI-Agent, der sich in Messaging-Apps integriert und über ein dateibasiertes System ein dauerhaftes Gedächtnis bewahrt. Wichtige Einrichtungsempfehlungen umfassen: mit der Terminaloberfläche beginnen, zunächst nur einen Messaging-Kanal verbinden und die SOUL.md-Datei korrekt für Persönlichkeit und Sicherheitsregeln konfigurieren.

OpenClawRadar
Claude Code Workflow Visual erklärt Speicherhierarchie und Fähigkeitensystem
Anleitungen

Claude Code Workflow Visual erklärt Speicherhierarchie und Fähigkeitensystem

Ein Reddit-Nutzer teilte ein visuelles Diagramm, das die Arbeitsablaufstruktur von Claude Code zeigt, einschließlich der Speicherschichtung mit CLAUDE.md-Dateien und wiederverwendbaren Fähigkeiten, die in .claude/skills/-Verzeichnissen definiert sind. Der Arbeitsablaufkreis schlägt vor, den Planmodus zu nutzen, Funktionen zu beschreiben, automatisch zu akzeptieren und häufig zu committen.

OpenClawRadar
Behebung der KV-Cache-Invalidierung von Claude Code mit lokalen Backends
Anleitungen

Behebung der KV-Cache-Invalidierung von Claude Code mit lokalen Backends

Claude Code Versionen 2.1.36+ fügen dynamische Telemetrie-Header und Git-Status-Updates in jede Anfrage ein, was Präfix-Matching unterbricht und eine vollständige Neuverarbeitung von Systemprompts mit 20K+ Token auf lokalen Backends wie llama.cpp erzwingt. Eine Konfigurationskorrektur in ~/.claude/settings.json kann die Verarbeitungszeit von 60+ Sekunden auf etwa 4 Sekunden reduzieren.

OpenClawRadar