Routerly : Passerelle LLM auto-hébergée avec politiques de routage en temps réel et contrôle budgétaire

✍️ OpenClawRadar📅 Publié: April 19, 2026🔗 Source
Routerly : Passerelle LLM auto-hébergée avec politiques de routage en temps réel et contrôle budgétaire
Ad

Routerly est une passerelle LLM auto-hébergée conçue pour combler les lacunes des solutions existantes. Le développeur l'a créée parce qu'OpenRouter est basé sur le cloud, et il voulait quelque chose d'exécutable sur sa propre infrastructure, tandis que le routage de LiteLLM semblait trop manuel malgré une bonne gestion du budget.

Fonctionnalités principales

Au lieu de coder en dur un modèle spécifique dans votre application, Routerly vous permet de définir des politiques de routage qui déterminent la sélection du modèle en temps réel. Les politiques disponibles incluent :

  • Le moins cher
  • Le plus rapide
  • Le plus performant
  • Des combinaisons de ces politiques

Le contrôle budgétaire fonctionne au niveau du projet avec un suivi réel par token, offrant une gestion granulaire des coûts.

Compatibilité et utilisation

Routerly est compatible OpenAI, ce qui signifie qu'elle peut s'intégrer dans des flux de travail existants sans modification de code. Les outils compatibles spécifiquement mentionnés incluent :

  • Cursor
  • LangChain
  • Open WebUI

Elle fonctionne avec "tout autre outil" qui utilise le format d'API OpenAI.

Ad

État actuel

Le développeur reconnaît qu'il reste des imperfections et sollicite les retours de la communauté sur :

  • Ce qui ne fonctionne pas
  • Ce qui manque
  • Si la logique de routage est pertinente en pratique
  • Si cela résout un vrai problème que les gens rencontrent

L'outil est entièrement gratuit et open source, sans argumentaire commercial. Le développeur se concentre sur les retours pratiques de la communauté technique.

Ressources

  • Dépôt GitHub : https://github.com/Inebrio/Routerly
  • Site web : https://www.routerly.ai

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Slides-grab : Éditeur visuel pour corriger les diapositives HTML générées par Claude Code
Tools

Slides-grab : Éditeur visuel pour corriger les diapositives HTML générées par Claude Code

Slides-grab est un outil qui vous permet de faire glisser des éléments sur des diapositives HTML/CSS générées par Claude Code, puis envoie le XPath et une capture d'écran mise en évidence à l'agent IA pour une édition précise. Il résout le problème de corriger de petits problèmes de mise en page uniquement par des invites textuelles.

OpenClawRadar
agent-recall : MCP SQLite local pour une mémoire de code Claude persistante
Tools

agent-recall : MCP SQLite local pour une mémoire de code Claude persistante

agent-recall est un serveur MCP qui donne à Claude Code une mémoire persistante entre les sessions en utilisant un fichier SQLite local. Il fournit 9 outils MCP pour sauvegarder des entités, des relations et des observations, avec des résumés générés par IA au début de chaque session au lieu de déversements de données brutes.

OpenClawRadar
SimSense MCP Connecteur Offre à Claude des Artéfacts des URL Permanentes avec un État Persistant
Tools

SimSense MCP Connecteur Offre à Claude des Artéfacts des URL Permanentes avec un État Persistant

SimSense est un connecteur MCP qui permet à Claude de déployer des artefacts HTML/JS générés sur des URL permanentes appelées 'sims' avec un stockage d'état persistant. L'outil résout la limitation où la sortie de Claude disparaît lorsque vous fermez la fenêtre de chat.

OpenClawRadar
Le plugin Claude-ETA ajoute le chronométrage des tâches et la détection de boucles de réparation à Claude Code.
Tools

Le plugin Claude-ETA ajoute le chronométrage des tâches et la détection de boucles de réparation à Claude Code.

Claude-ETA est un plugin Claude Code qui chronomètre les tâches, apprend votre vitesse réelle et renvoie des données réelles à Claude avant qu'il ne réponde. Il détecte également les boucles de réparation en identifiant le contenu des erreurs et intervient après trois échecs identiques.

OpenClawRadar