Enrutar el tráfico de la API de Claude para controlar costos tras el cambio de suscripción Max

✍️ OpenClawRadar📅 Publicado: 13 de abril de 2026🔗 Source
Enrutar el tráfico de la API de Claude para controlar costos tras el cambio de suscripción Max
Ad

Migración a facturación por API e implicaciones de costos

A partir del mediodía PT, la suscripción Max de Anthropic ya no cubre el uso de herramientas de terceros como OpenClaw. Todos los usuarios de OpenClaw ahora están en facturación por API con estas tarifas:

  • Claude Opus 4.6: $5 por millón de tokens de entrada, $25 por millón de tokens de salida
  • Claude Sonnet 4.6: $3 por millón de tokens de entrada, $15 por millón de tokens de salida
  • Claude Haiku 4.5: $1 por millón de tokens de entrada, $5 por millón de tokens de salida

Una sesión intensa de OpenClaw en Opus puede costar $1-4, mientras que la misma sesión en Sonnet cuesta $0.20-0.80 con resultados similares para la mayoría de las tareas.

Ad

La solución de enrutamiento

La mayoría de las operaciones de OpenClaw no requieren Opus: verificaciones de latido, lecturas de archivos, resúmenes, decisiones de enrutamiento y llamadas cortas a herramientas pueden ser manejadas por Sonnet. Sin una capa de enrutamiento, cada solicitud llega a tu modelo predeterminado, potencialmente desperdiciando el presupuesto de Opus en tareas simples.

Un proxy local enruta las solicitudes de Claude por complejidad: las tareas simples van automáticamente a Sonnet, las complejas escalan a Opus. Este enfoque ha reducido significativamente los costos sin pérdida de calidad en tareas importantes.

El proxy es de código abierto y se puede instalar vía npm: npm install -g @relayplane/proxy

La documentación detallada y la discusión están disponibles en r/ClaudeCode, donde la solución ha recibido 52K vistas.

📖 Read the full source: r/openclaw

Ad

👀 Ver también

🦀
Herramientas

Encuesta de servidores de memoria Markdown local para agentes de IA: Mem0, Hindsight, Zep y el recién llegado Engram

Un usuario probó ~20 sistemas de memoria local para agentes que almacenan memorias como archivos editables. Engram (de Obsidian68) fue el único que cumplió con todos los requisitos: completamente local, almacenamiento en Markdown, deduplicación inteligente, decaimiento de importancia y servidor independiente.

OpenClawRadar
Noren AI: Herramienta de Extracción de Voz Identifica Patrones de Escritura a partir de Muestras
Herramientas

Noren AI: Herramienta de Extracción de Voz Identifica Patrones de Escritura a partir de Muestras

Noren AI analiza de 5 a 10 muestras de escritura para generar automáticamente una guía de voz basada en patrones reales, coincidiendo con el 90% de los patrones identificados manualmente y descubriendo otros adicionales.

OpenClawRadar
Control de Nodos: Juego Multijugador en Tiempo Real .io Construido Enteramente con Claude 4.6 y 4.7
Herramientas

Control de Nodos: Juego Multijugador en Tiempo Real .io Construido Enteramente con Claude 4.6 y 4.7

Un desarrollador creó un juego multijugador competitivo en vivo .io, Node Control, usando Claude 4.6 y 4.7. Incluye netcode autoritativo del servidor a 60Hz, despliegue en 4 regiones en fly.io y una estética de red neural.

OpenClawRadar
OpenSwarm: Orquestrador CLI Multi-Agente de Claude para Linear y GitHub
Herramientas

OpenSwarm: Orquestrador CLI Multi-Agente de Claude para Linear y GitHub

OpenSwarm orquesta múltiples instancias de CLI de Claude Code como agentes autónomos que extraen problemas de Linear y ejecutan pipelines de Trabajador/Revisor/Prueba/Documentador. Utiliza LanceDB con incrustaciones multilingües-e5 para la memoria e incluye control de bot de Discord, mejora automática de PR y un panel web.

OpenClawRadar