Routerly: Puerta de Enlace LLM Autohospedada con Políticas de Enrutamiento en Tiempo de Ejecución y Control de Presupuesto

Routerly es una puerta de enlace LLM autoalojada creada para abordar las carencias de las soluciones existentes. El desarrollador la creó porque OpenRouter está basado en la nube y querían algo que pudiera ejecutarse en su propia infraestructura, mientras que el enrutamiento de LiteLLM les parecía demasiado manual a pesar de manejar bien el presupuesto.
Características principales
En lugar de codificar un modelo específico en tu aplicación, Routerly te permite definir políticas de enrutamiento que determinan la selección del modelo en tiempo de ejecución. Las políticas disponibles incluyen:
- Más barato
- Más rápido
- Más capaz
- Combinaciones de estas políticas
El control del presupuesto opera a nivel de proyecto con seguimiento real por token, proporcionando una gestión de costos granular.
Compatibilidad y uso
Routerly es compatible con OpenAI, lo que significa que puede integrarse en flujos de trabajo existentes sin cambios de código. Las herramientas compatibles mencionadas específicamente incluyen:
- Cursor
- LangChain
- Open WebUI
Funciona con "cualquier otra cosa" que utilice el formato de API de OpenAI.
Estado actual
El desarrollador reconoce que hay aspectos por pulir y está buscando comentarios de la comunidad sobre:
- Qué está roto
- Qué falta
- Si la lógica de enrutamiento tiene sentido en la práctica
- Si resuelve un problema real que tienen las personas
La herramienta es completamente gratuita y de código abierto, sin ningún discurso comercial de venta. El desarrollador se centra en comentarios prácticos de la comunidad técnica.
Recursos
- Repositorio de GitHub: https://github.com/Inebrio/Routerly
- Sitio web: https://www.routerly.ai
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Depurando la lógica de verificación de compilación de Claude Code: Por qué falla la búsqueda de nombres y la búsqueda de huella estructural lo soluciona
Claude Code le dijo a un usuario que 'la función no está construida' cuatro veces en una misma sesión, todas incorrectas. La solución: reemplazar la búsqueda por nombre con la búsqueda por huella estructural (rutas, esquemas, herramientas registradas). Se comparte una regla práctica.

Google PM publica como código abierto un agente de memoria siempre activo con almacenamiento SQLite, sin base de datos vectorial.
Shubham Saboo, gerente sénior de productos de IA en Google, ha liberado como código abierto un Agente de Memoria Siempre Activo que almacena recuerdos estructurados en SQLite en lugar de utilizar bases de datos vectoriales, funcionando con Gemini 3.1 Flash-Lite con consolidación de memoria programada cada 30 minutos.

Clawback: Implementación basada en hooks de bucles de verificación de Claude filtrados
Clawback es un proyecto de GitHub que reimplementa los bucles de verificación de la filtración del mapa de fuentes de Claude como ganchos mecánicos en lugar de prompts. Incluye ganchos de parada, PreToolUse, PostToolUse y PostCompact que el modelo no puede omitir bajo presión de contexto.

Foreman: Bot de Slack de Código Abierto para el Control Remoto del Código Local de Claude
Foreman es un bot de Slack gratuito y de código abierto que proporciona control remoto para instancias locales de Claude Code. Permite a los desarrolladores enviar tareas a Claude desde su teléfono mientras mantienen acceso completo local al sistema de archivos, herramientas y entorno.