Routerly : Passerelle LLM auto-hébergée avec politiques de routage en temps réel et contrôle budgétaire

Routerly est une passerelle LLM auto-hébergée conçue pour combler les lacunes des solutions existantes. Le développeur l'a créée parce qu'OpenRouter est basé sur le cloud, et il voulait quelque chose d'exécutable sur sa propre infrastructure, tandis que le routage de LiteLLM semblait trop manuel malgré une bonne gestion du budget.
Fonctionnalités principales
Au lieu de coder en dur un modèle spécifique dans votre application, Routerly vous permet de définir des politiques de routage qui déterminent la sélection du modèle en temps réel. Les politiques disponibles incluent :
- Le moins cher
- Le plus rapide
- Le plus performant
- Des combinaisons de ces politiques
Le contrôle budgétaire fonctionne au niveau du projet avec un suivi réel par token, offrant une gestion granulaire des coûts.
Compatibilité et utilisation
Routerly est compatible OpenAI, ce qui signifie qu'elle peut s'intégrer dans des flux de travail existants sans modification de code. Les outils compatibles spécifiquement mentionnés incluent :
- Cursor
- LangChain
- Open WebUI
Elle fonctionne avec "tout autre outil" qui utilise le format d'API OpenAI.
État actuel
Le développeur reconnaît qu'il reste des imperfections et sollicite les retours de la communauté sur :
- Ce qui ne fonctionne pas
- Ce qui manque
- Si la logique de routage est pertinente en pratique
- Si cela résout un vrai problème que les gens rencontrent
L'outil est entièrement gratuit et open source, sans argumentaire commercial. Le développeur se concentre sur les retours pratiques de la communauté technique.
Ressources
- Dépôt GitHub : https://github.com/Inebrio/Routerly
- Site web : https://www.routerly.ai
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

Slides-grab : Éditeur visuel pour corriger les diapositives HTML générées par Claude Code
Slides-grab est un outil qui vous permet de faire glisser des éléments sur des diapositives HTML/CSS générées par Claude Code, puis envoie le XPath et une capture d'écran mise en évidence à l'agent IA pour une édition précise. Il résout le problème de corriger de petits problèmes de mise en page uniquement par des invites textuelles.

agent-recall : MCP SQLite local pour une mémoire de code Claude persistante
agent-recall est un serveur MCP qui donne à Claude Code une mémoire persistante entre les sessions en utilisant un fichier SQLite local. Il fournit 9 outils MCP pour sauvegarder des entités, des relations et des observations, avec des résumés générés par IA au début de chaque session au lieu de déversements de données brutes.

SimSense MCP Connecteur Offre à Claude des Artéfacts des URL Permanentes avec un État Persistant
SimSense est un connecteur MCP qui permet à Claude de déployer des artefacts HTML/JS générés sur des URL permanentes appelées 'sims' avec un stockage d'état persistant. L'outil résout la limitation où la sortie de Claude disparaît lorsque vous fermez la fenêtre de chat.

Le plugin Claude-ETA ajoute le chronométrage des tâches et la détection de boucles de réparation à Claude Code.
Claude-ETA est un plugin Claude Code qui chronomètre les tâches, apprend votre vitesse réelle et renvoie des données réelles à Claude avant qu'il ne réponde. Il détecte également les boucles de réparation en identifiant le contenu des erreurs et intervient après trois échecs identiques.