Orkestra: Kostenbewusste LLM-Routing-Schicht für OpenClaw reduziert API-Kosten um 60–80 %

✍️ OpenClawRadar📅 Veröffentlicht: 28. Februar 2026🔗 Source

Was Orkestra tut

Orkestra ist eine kostenbewusste LLM-Routing-Schicht für OpenClaw, die API-Kosten um 60-80 % reduziert. Es handelt sich um eine modulare Architektur, die vor Modellaufrufen sitzt und basierend auf semantischer Ähnlichkeit entscheidet, welche Stufe jede Anfrage bearbeiten soll.

Wie es funktioniert

Wenn ein Prompt eingeht, wird er eingebettet und durch einen leichten KNN-Klassifikator geleitet, der auf zuvor gelabelten Workloads trainiert wurde. Basierend auf semantischer Ähnlichkeit kategorisiert der Router ihn als budget, balanced oder premium und leitet den Aufruf entsprechend weiter.

Es gibt keine Prompt-Umschreibung und keinen komplexen Regelbaum – nur semantische Klassifizierung zum Zeitpunkt des Aufrufs. Die Reduzierung der API-Kosten kommt hauptsächlich dadurch zustande, dass einfachere Prompts nicht standardmäßig an die teuersten Modelle weitergeleitet werden.

Integration mit OpenClaw

Orkestra wird als OpenClaw-Skill über einen lokalen Proxy eingebunden, sodass bestehende Pipelines vollständig intakt bleiben. Der Agent ruft es über bash/curl an einen OpenAI-kompatiblen Endpunkt unter 127.0.0.1:8765 auf.

Die Antwort enthält vollständige Kostentransparenz mit den Feldern _orkestra.cost und _orkestra.savings_percent.

Unterstützte Anbieter und Konfiguration

Unterstützte Anbieter: Google (Gemini), Anthropic (Claude), OpenAI
Routing über Budget-/Balanced-/Premium-Stufen innerhalb jedes Anbieters
Unterstützt Multi-Provider-Modus über alle drei Anbieter
Repository und OpenClaw-Integration verfügbar unter: github.com/imperativelabs/orkestra
Siehe integrations/openclaw/ für die Skill-Dateien, Proxy und Konfigurationsbeispiele

📖 Read the full source: r/openclaw

👀 Siehe auch

Werkzeuge

OpenHelm: Eine macOS-App zur Automatisierung von Claude-Code-Aufgaben

OpenHelm ist eine kostenlose, lokale macOS-Anwendung, die repetitive Claude-Coding-Aufgaben automatisiert, indem sie Jobs nach Zeitplan ausführt, Fehler automatisch wiederholt und Arbeit in Teile aufteilt, um Sitzungslimits zu vermeiden. Sie nutzt Ihr bestehendes Claude-Abonnement für LLM-Aufrufe.

7. Apr. 2026, 00:45 UTC

OpenClawRadar

Werkzeuge

Sentrial: Produktionsüberwachung für KI-Agenten

Sentrial ist ein Überwachungstool, das automatisch Fehlermuster in KI-Produkten erkennt, einschließlich Schleifen, Halluzinationen, Werkzeugmissbrauch und Nutzerfrustration. Es diagnostiziert Ursachen durch die Analyse von Gesprächsmustern, Modellausgaben und Werkzeuginteraktionen.

12. März 2026, 08:45 UTC

OpenClawRadar

Werkzeuge

Benchmark-Ergebnisse: GitHub CLI vs. MCP-Ansätze für KI-Agenten

Ein unabhängiger Benchmark verglich GitHub CLI, MCP, MCP mit Tool Search und MCP mit Code Mode für KI-Agenten-Aufgaben. GitHub CLI war die kosteneffizienteste Lösung, während MCP-Ansätze Kompromisse bei Kosten, Latenz und Fehlermodi zeigten.

28. März 2026, 20:45 UTC

OpenClawRadar

Werkzeuge

Interaktive Mind Map visualisiert das Claude-Tool-Ökosystem

Ein Entwickler hat eine interaktive HTML-Mindmap mit D3.js erstellt, um Funktionen in den Claude-Tools Chat, Cowork und Code zu verfolgen, einschließlich Plattformverfügbarkeit, Preisunterschieden und Kompatibilität von Konnektoren.

8. März 2026, 09:45 UTC

OpenClawRadar