Routerly: Selbst gehostetes LLM-Gateway mit Laufzeit-Routingrichtlinien und Budgetkontrolle

Routerly ist ein selbst gehostetes LLM-Gateway, das entwickelt wurde, um Lücken in bestehenden Lösungen zu schließen. Der Entwickler hat es erstellt, weil OpenRouter cloudbasiert ist und er etwas wollte, das auf eigener Infrastruktur läuft, während das Routing von LiteLLM trotz guter Budgetverwaltung zu manuell erschien.
Kernfunktionen
Anstatt ein bestimmtes Modell in Ihrer Anwendung fest zu kodieren, ermöglicht Routerly Ihnen, Routing-Richtlinien zu definieren, die die Modellauswahl zur Laufzeit bestimmen. Verfügbare Richtlinien umfassen:
- Günstigste
- Schnellste
- Leistungsfähigste
- Kombinationen dieser Richtlinien
Die Budgetkontrolle erfolgt auf Projektebene mit tatsächlicher Token-für-Token-Nachverfolgung, was eine detaillierte Kostenverwaltung ermöglicht.
Kompatibilität und Nutzung
Routerly ist OpenAI-kompatibel, was bedeutet, dass es in bestehende Arbeitsabläufe ohne Codeänderungen integriert werden kann. Speziell erwähnte kompatible Tools sind:
- Cursor
- LangChain
- Open WebUI
Es funktioniert mit „allen anderen“ Tools, die das OpenAI-API-Format verwenden.
Aktueller Status
Der Entwickler räumt ein, dass es noch Unausgereiftes gibt und sucht Feedback der Community zu:
- Was kaputt ist
- Was fehlt
- Ob die Routing-Logik in der Praxis sinnvoll ist
- Ob es ein echtes Problem löst, das Menschen haben
Das Tool ist völlig kostenlos und quelloffen, ohne kommerzielle Verkaufsabsicht. Der Entwickler konzentriert sich auf praktisches Feedback aus der technischen Community.
Ressourcen
- GitHub-Repository: https://github.com/Inebrio/Routerly
- Website: https://www.routerly.ai
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Heartbeat-Gateway: Ereignisgesteuerter Ersatz für Cron-Abfragen in OpenClaw
Heartbeat-gateway ist ein Open-Source-Python-Tool, das cron-basiertes Polling durch Webhook-gesteuerte Ereignisse für OpenClaw ersetzt. Es reduziert die API-Kosten von ~86 $/Monat auf ~4,50 $/Monat und verbessert die Latenz von bis zu 30 Minuten auf unter 2 Sekunden.

Künstliches Leben: Eine 300-zeilige Python-Reproduktion der Computational-Life-Forschung
Eine Python-Implementierung, die das Computational-Life-Papier reproduziert, bei der ein 240x135-Raster aus Brainfuck-ähnlichen Programmen interagiert und sich selbst replizierenden Code durch zufällige Paarung und Verkettung von Instruktionsbändern entwickelt.

Tripsy startet MCP-Server für Claude: Reisen über strukturierte API verwalten
Der offizielle MCP-Server von Tripsy ermöglicht es Claude, Reisen, Aktivitäten, Unterkünfte, Transport und Ausgaben direkt zu lesen, zu erstellen und zu aktualisieren. Die Einrichtung dauert etwa eine Minute über Claudes benutzerdefinierten Connector.

Open-Source Benchmark Runner zum Testen von OpenClaw-Agenten in realen Workflows
Ein neues Open-Source-Projekt ermöglicht es Ihnen, OpenClaw-Agenten anhand Ihrer eigenen privaten, praxisnahen Aufgaben zu bewerten, die in YAML definiert sind, mit Unterstützung zum Importieren tatsächlicher Agenten-Workspaces.