Orkestra: Kostenbewusste LLM-Routing-Schicht für OpenClaw reduziert API-Kosten um 60–80 %

✍️ OpenClawRadar📅 Veröffentlicht: 28. Februar 2026🔗 Source
Orkestra: Kostenbewusste LLM-Routing-Schicht für OpenClaw reduziert API-Kosten um 60–80 %
Ad

Was Orkestra tut

Orkestra ist eine kostenbewusste LLM-Routing-Schicht für OpenClaw, die API-Kosten um 60-80 % reduziert. Es handelt sich um eine modulare Architektur, die vor Modellaufrufen sitzt und basierend auf semantischer Ähnlichkeit entscheidet, welche Stufe jede Anfrage bearbeiten soll.

Wie es funktioniert

Wenn ein Prompt eingeht, wird er eingebettet und durch einen leichten KNN-Klassifikator geleitet, der auf zuvor gelabelten Workloads trainiert wurde. Basierend auf semantischer Ähnlichkeit kategorisiert der Router ihn als budget, balanced oder premium und leitet den Aufruf entsprechend weiter.

Es gibt keine Prompt-Umschreibung und keinen komplexen Regelbaum – nur semantische Klassifizierung zum Zeitpunkt des Aufrufs. Die Reduzierung der API-Kosten kommt hauptsächlich dadurch zustande, dass einfachere Prompts nicht standardmäßig an die teuersten Modelle weitergeleitet werden.

Ad

Integration mit OpenClaw

Orkestra wird als OpenClaw-Skill über einen lokalen Proxy eingebunden, sodass bestehende Pipelines vollständig intakt bleiben. Der Agent ruft es über bash/curl an einen OpenAI-kompatiblen Endpunkt unter 127.0.0.1:8765 auf.

Die Antwort enthält vollständige Kostentransparenz mit den Feldern _orkestra.cost und _orkestra.savings_percent.

Unterstützte Anbieter und Konfiguration

  • Unterstützte Anbieter: Google (Gemini), Anthropic (Claude), OpenAI
  • Routing über Budget-/Balanced-/Premium-Stufen innerhalb jedes Anbieters
  • Unterstützt Multi-Provider-Modus über alle drei Anbieter
  • Repository und OpenClaw-Integration verfügbar unter: github.com/imperativelabs/orkestra
  • Siehe integrations/openclaw/ für die Skill-Dateien, Proxy und Konfigurationsbeispiele

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

Ernährungs-MCP-Server mit Claude Code für Lebensmittel-Tagebuch-Export
Werkzeuge

Ernährungs-MCP-Server mit Claude Code für Lebensmittel-Tagebuch-Export

Ein Entwickler hat einen Ernährung-MCP-Server mit Claude Code erstellt, nachdem kommerzielle Apps den Datenexport blockierten, und damit ein Tool geschaffen, das Mahlzeiten über Claude erfasst, Zusammenfassungen generiert und in Excel exportiert, ohne zwischen Apps wechseln zu müssen.

OpenClawRadar
Ninetails Memory Engine V4.5: Int8-Quantisierung + LRU-Cache reduziert lokalen MCP-Speicher auf 60 MB
Werkzeuge

Ninetails Memory Engine V4.5: Int8-Quantisierung + LRU-Cache reduziert lokalen MCP-Speicher auf 60 MB

Die Ninetails Memory Engine V4.5 nutzt Int8-Skalarquantisierung und LRU-Cache-Auslagerung, um die Vektorspeicherung von 6 KB auf 1,5 KB pro Embedding zu reduzieren, wobei die gesamte Engine bei 40–60 MB RAM bleibt. Sie kombiniert 70 % Vektorähnlichkeit mit 30 % BM25-Suche in einer vollständig lokalen SQLite-Implementierung.

OpenClawRadar
Claude IDE Bridge: WebSocket-Tool für Echtzeit-IDE-Zugriff
Werkzeuge

Claude IDE Bridge: WebSocket-Tool für Echtzeit-IDE-Zugriff

claude-ide-bridge ist eine WebSocket-Brücke, die Claude Code direkt mit dem internen Zustand der IDE verbindet und so Live-Diagnosen, Gehe-zur-Definition, Referenzsuche, Typ-Hovering, Dateiöffnung, Breakpoint-Verwaltung und Debugger-Zustandsstreaming ermöglicht.

OpenClawRadar
Übersetzen auf Deutsch: Claude Code Workflow Visuelle Details Speicherhierarchie und Fähigkeitensystem
Werkzeuge

Übersetzen auf Deutsch: Claude Code Workflow Visuelle Details Speicherhierarchie und Fähigkeitensystem

Ein Reddit-Nutzer teilte ein visuelles Diagramm, das zeigt, wie Claude Code den Speicher durch geschichtete CLAUDE.md-Dateien organisiert und wiederverwendbare Fähigkeiten über SKILL.md-Dateien implementiert. Der Workflow-Loop schlägt vor, den Plan-Modus mit automatischer Annahme und häufigen Commits zu nutzen.

OpenClawRadar