Ollama-Fallback-Kette in KI-IDE: Multi-Provider-LLM-Integration

Resonant Genesis, eine produktive AI-IDE-Plattform, hat lokale LLM-Unterstützung als erstklassigen Anbieter in ihre Architektur integriert. Die Plattform läuft über 30+ Microservices hinweg und behandelt lokale Modelle gleichwertig wie Cloud-Anbieter wie Groq, OpenAI, Anthropic und Gemini.

Architektur und Integration

Die Plattform verwendet eine gemeinsame rg_llm-Bibliothek namens UnifiedLLMClient, die volumen-gemountet über alle Dienste hinweg verfügbar ist. Jeder Microservice, der LLM-Fähigkeiten benötigt, importiert denselben Client. Die Fallback-Kette ist konfiguriert als: Groq → OpenAI → Anthropic → Gemini → Ollama/LM Studio.

Die Thin-Client-Erweiterung der IDE entdeckt automatisch lokale Ollama-Modelle und fügt sie der Anbieterliste hinzu. Benutzer können das System so konfigurieren, dass lokale Modelle bevorzugt werden, wenn gewünscht.

Serverseitige Orchestrierung

Die gesamte Orchestrierung erfolgt serverseitig, wobei die IDE als Thin-Client fungiert, der die Benutzeroberfläche rendert, lokale Tools ausführt (Dateioperationen, Terminal, Git) und Ergebnisse über Server-Sent Events (SSE) streamt. Die agentische Schleife, Tool-Auswahl, System-Prompts und LLM-Routing finden alle auf dem Server statt.

Bei Verwendung eines lokalen Modells durchläuft es denselben kontrollierten Ausführungspipeline:

Vorausführungsrichtlinien-Durchsetzung (blockiert Aktionen, bevor sie ausgeführt werden)
Native Funktionsaufrufe über Provider-APIs (keine JSON-Prompt-Injektion)
Kryptografische Identität (DSID auf Ethereum L2) für jeden Agenten
Dieselben 59 lokalen Tools verfügbar, unabhängig davon, welchen LLM-Anbieter Sie wählen

Vorteile für lokale LLM-Benutzer

Für Benutzer, die Ollama lokal ausführen, bietet diese Architektur:

Datenschutz: Thin-Client-Architektur bedeutet keine Unternehmensintelligenz in der Binärdatei, und mit lokalen Modellen bleiben Prompts lokal
Tool-Nutzung: 59 lokale Tools mit nativen Funktionsaufrufen, keine prompt-injizierten JSON-Schemata
Fallback: Wenn ein lokales Modell eine komplexe Aufgabe nicht bewältigen kann, fällt es automatisch auf Cloud-Anbieter zurück

Die Entwickler suchen Feedback von Personen, die lokale Modelle ausführen, insbesondere bezüglich der Funktionsaufrufleistung mit kleineren Modellen und welche Modelle sich gut für agentische Tool-Nutzung eignen.

Das Projekt ist Open Source auf GitHub, und ein Gast-Chat, der das Tool-Ökosystem demonstriert, ist live auf dev-swat.com (verwendet Cloud-Modelle).

📖 Read the full source: r/LocalLLaMA

Mehrfach-Anbieter-LLM-Fallback-Kette mit Ollama-Unterstützung in der produktiven KI-IDE

Architektur und Integration

Serverseitige Orchestrierung

Vorteile für lokale LLM-Benutzer

👀 Siehe auch

Claude Tag: @Claude auf Slack für KI-Zusammenarbeit im Mehrspielermodus

Eine 7-Dateien-Governance-Ebene zur Verhinderung von LLM-Sitzungsdrift

Claude Code verhindert Störungen zwischen Chrome-Tabs bei mehreren Sitzungen

SkyClaw: Rust AI Agent Runtime für Cloud VPS mit Telegram-Steuerung