Orkestra: Kostenbewusste LLM-Routing-Schicht für OpenClaw reduziert API-Kosten um 60–80 %

Was Orkestra tut
Orkestra ist eine kostenbewusste LLM-Routing-Schicht für OpenClaw, die API-Kosten um 60-80 % reduziert. Es handelt sich um eine modulare Architektur, die vor Modellaufrufen sitzt und basierend auf semantischer Ähnlichkeit entscheidet, welche Stufe jede Anfrage bearbeiten soll.
Wie es funktioniert
Wenn ein Prompt eingeht, wird er eingebettet und durch einen leichten KNN-Klassifikator geleitet, der auf zuvor gelabelten Workloads trainiert wurde. Basierend auf semantischer Ähnlichkeit kategorisiert der Router ihn als budget, balanced oder premium und leitet den Aufruf entsprechend weiter.
Es gibt keine Prompt-Umschreibung und keinen komplexen Regelbaum – nur semantische Klassifizierung zum Zeitpunkt des Aufrufs. Die Reduzierung der API-Kosten kommt hauptsächlich dadurch zustande, dass einfachere Prompts nicht standardmäßig an die teuersten Modelle weitergeleitet werden.
Integration mit OpenClaw
Orkestra wird als OpenClaw-Skill über einen lokalen Proxy eingebunden, sodass bestehende Pipelines vollständig intakt bleiben. Der Agent ruft es über bash/curl an einen OpenAI-kompatiblen Endpunkt unter 127.0.0.1:8765 auf.
Die Antwort enthält vollständige Kostentransparenz mit den Feldern _orkestra.cost und _orkestra.savings_percent.
Unterstützte Anbieter und Konfiguration
- Unterstützte Anbieter: Google (Gemini), Anthropic (Claude), OpenAI
- Routing über Budget-/Balanced-/Premium-Stufen innerhalb jedes Anbieters
- Unterstützt Multi-Provider-Modus über alle drei Anbieter
- Repository und OpenClaw-Integration verfügbar unter: github.com/imperativelabs/orkestra
- Siehe
integrations/openclaw/für die Skill-Dateien, Proxy und Konfigurationsbeispiele
📖 Read the full source: r/openclaw
👀 Siehe auch

Nit: Ein Git-Ersatz in Zig, optimiert für die Token-Effizienz von KI-Agenten
Nit ist ein natives Git-Ersatzprogramm, geschrieben in Zig, das den Token-Verbrauch bei gängigen Befehlen wie status, diff, log und show um 35-87% reduziert. Dies wird durch kompakte Standardausgaben und direkte libgit2-Integration erreicht, wodurch der Overhead von Subprozessen entfällt.

Cowork vs. Claude Chat: Vergleich der Genauigkeit bei der Dokumentenextraktion
Ein Entwickler testete Claude.ai Chat und Cowork beim Extrahieren von Daten aus 140+ Seiten langen Finanz-PDFs mit identischen Prompts. Chat lieferte institutionelle Ergebnisse mit Selbstkorrektur und null Fehlern über 150+ Datenpunkte, während Cowork ausgleichende Posten erfand, Einheitenzahlen umkehrte und Vorjahresspalten kontaminierte.

latexnav: Python-Tool zur Navigation von LaTeX-Dateien für LLM und Menschen
latexnav ist ein kostenloses Open-Source-Python-Tool, das LaTeX-Dateien analysiert, um strukturelle Elemente wie Theoreme, Definitionen, Abschnitte, Labels, Querverweise und Abhängigkeiten zu extrahieren. Es liefert Zusammenfassungen mit autoritativen Zeilennummern, um LLMs und Menschen dabei zu helfen, große Manuskripte effizient zu navigieren.

Erstellen von syntaqlite: Ein SQLite-Entwicklungswerkzeug-Projekt, das mit KI-Unterstützung erstellt wurde
Lalit Maganti baute syntaqlite, eine Reihe von Entwicklertools für SQLite, in drei Monaten mithilfe von KI-Codierungsagenten, nachdem er es acht Jahre lang gewollt hatte. Das Projekt erforderte das genaue Parsen von SQL wie SQLite, was die Anpassung von SQLites dichtem C-Codebase mit über 400 Grammatikregeln beinhaltet.