RelayPlane: proxy open source reduce 73% costos con Claude

Proxy de Código Abierto para el Enrutamiento de la API de Claude

RelayPlane es un proxy nativo de npm de código abierto que se sitúa frente a la API de Anthropic. La herramienta fue construida usando Claude Code, lo que aceleró el desarrollo. Es gratuito para autoalojar y está diseñado para manejar el enrutamiento entre diferentes modelos Claude según la complejidad del prompt.

Resultados de Pruebas Comparativas y Configuración

La prueba comparativa utilizó una carga de trabajo mixta con 60% de tareas simples y 40% de tareas complejas. Se compararon dos escenarios:

Directo (todo Sonnet): latencia p50 1,55s, costo por 10 solicitudes $0,0323
Vía RelayPlane con enrutamiento: latencia p50 0,78s, costo por 10 solicitudes $0,0086

Esto representa una reducción de costos del 73,4%. Con 10.000 solicitudes por día, esto se traduce en aproximadamente $712 de ahorro mensual.

Configuración de Enrutamiento

La configuración de enrutamiento es sencilla:

{
  "routing": {
    "complexity": {
      "enabled": true,
      "simple": "claude-haiku-4-5",
      "moderate": "claude-sonnet-4-6",
      "complex": "claude-opus-4-6"
    }
  }
}

La lógica de enrutamiento utiliza un clasificador de complejidad que examina el recuento de tokens, indicadores de código y palabras clave analíticas. Los encabezados de respuesta incluyen x-relayplane-routed-model para verificar qué modelo procesó realmente la solicitud.

Precios de Modelos y Lógica de Enrutamiento

El sistema de enrutamiento dirige los prompts a los modelos apropiados según la complejidad:

Prompts simples → Haiku ($0,80 por millón de tokens)
Prompts moderados → Sonnet ($3 por millón de tokens)
Prompts complejos → Opus ($15 por millón de tokens)

El autor señala que el clasificador no es perfecto pero es "suficientemente bueno para capturar la mayor parte del ahorro". La metodología completa de las pruebas comparativas está disponible en un Gist vinculado en el material fuente.

📖 Read the full source: r/ClaudeAI

RelayPlane Proxy de Código Abierto Muestra una Reducción del 73% en Costos con Enrutamiento del Modelo Claude

Proxy de Código Abierto para el Enrutamiento de la API de Claude

Resultados de Pruebas Comparativas y Configuración

Configuración de Enrutamiento

Precios de Modelos y Lógica de Enrutamiento

👀 Ver también

Sociality.io lanza MCP Server para Claude: Inteligencia de redes sociales en vivo mediante OAuth

Problemas Técnicos y Controversia Comunitaria de Ollama

TeenyApp permite a Claude construir y desplegar sitios web full-stack desde un solo enlace de chat

Memorine: Un Sistema de Memoria Local para Agentes OpenClaw Utilizando Python y SQLite