Enrutar el tráfico de la API de Claude para controlar costos tras el cambio de suscripción Max

Migración a facturación por API e implicaciones de costos
A partir del mediodía PT, la suscripción Max de Anthropic ya no cubre el uso de herramientas de terceros como OpenClaw. Todos los usuarios de OpenClaw ahora están en facturación por API con estas tarifas:
- Claude Opus 4.6: $5 por millón de tokens de entrada, $25 por millón de tokens de salida
- Claude Sonnet 4.6: $3 por millón de tokens de entrada, $15 por millón de tokens de salida
- Claude Haiku 4.5: $1 por millón de tokens de entrada, $5 por millón de tokens de salida
Una sesión intensa de OpenClaw en Opus puede costar $1-4, mientras que la misma sesión en Sonnet cuesta $0.20-0.80 con resultados similares para la mayoría de las tareas.
La solución de enrutamiento
La mayoría de las operaciones de OpenClaw no requieren Opus: verificaciones de latido, lecturas de archivos, resúmenes, decisiones de enrutamiento y llamadas cortas a herramientas pueden ser manejadas por Sonnet. Sin una capa de enrutamiento, cada solicitud llega a tu modelo predeterminado, potencialmente desperdiciando el presupuesto de Opus en tareas simples.
Un proxy local enruta las solicitudes de Claude por complejidad: las tareas simples van automáticamente a Sonnet, las complejas escalan a Opus. Este enfoque ha reducido significativamente los costos sin pérdida de calidad en tareas importantes.
El proxy es de código abierto y se puede instalar vía npm: npm install -g @relayplane/proxy
La documentación detallada y la discusión están disponibles en r/ClaudeCode, donde la solución ha recibido 52K vistas.
📖 Read the full source: r/openclaw
👀 Ver también
Encuesta de servidores de memoria Markdown local para agentes de IA: Mem0, Hindsight, Zep y el recién llegado Engram
Un usuario probó ~20 sistemas de memoria local para agentes que almacenan memorias como archivos editables. Engram (de Obsidian68) fue el único que cumplió con todos los requisitos: completamente local, almacenamiento en Markdown, deduplicación inteligente, decaimiento de importancia y servidor independiente.

Noren AI: Herramienta de Extracción de Voz Identifica Patrones de Escritura a partir de Muestras
Noren AI analiza de 5 a 10 muestras de escritura para generar automáticamente una guía de voz basada en patrones reales, coincidiendo con el 90% de los patrones identificados manualmente y descubriendo otros adicionales.

Control de Nodos: Juego Multijugador en Tiempo Real .io Construido Enteramente con Claude 4.6 y 4.7
Un desarrollador creó un juego multijugador competitivo en vivo .io, Node Control, usando Claude 4.6 y 4.7. Incluye netcode autoritativo del servidor a 60Hz, despliegue en 4 regiones en fly.io y una estética de red neural.

OpenSwarm: Orquestrador CLI Multi-Agente de Claude para Linear y GitHub
OpenSwarm orquesta múltiples instancias de CLI de Claude Code como agentes autónomos que extraen problemas de Linear y ejecutan pipelines de Trabajador/Revisor/Prueba/Documentador. Utiliza LanceDB con incrustaciones multilingües-e5 para la memoria e incluye control de bot de Discord, mejora automática de PR y un panel web.