Anthropic cambia los términos de suscripción, los usuarios de OpenClaw ahora facturados por separado por el uso de agentes

Qué cambió con las suscripciones de Anthropic
Anthropic ha reducido el alcance de sus suscripciones a Claude. Ahora solo se aplican a superficies de primera parte: Claude.ai, Claude Code y la aplicación móvil. Todo lo demás se trata como un "arnés de terceros" y se factura por separado por token.
En la práctica, esto significa que tu plan Max ya no cubre el uso de agentes. Si pagas $200/mes y ejecutas agentes de OpenClaw, ahora pagas esa suscripción más los costos directos de la API por cada token que consuman tus agentes.
Tus opciones
- Mantenerse en Max y pagar extra: Probablemente estés viendo un total de $300-500/mes dependiendo de cuántos agentes ejecutes. Tiene sentido si también usas Claude AI directamente mucho. De lo contrario, los números no cuadran.
- Cambiarse a la API de Anthropic: Cancela la suscripción y ejecuta tus agentes con una clave API directa desde console.anthropic.com. Estos son los costos de algunos modelos Claude:
Opus 4.6: $5 entrada / $25 salida
Sonnet 4.6: $3 entrada / $15 salida
Haiku 3: $0.25 entrada / $1.25 salida
La mayoría de las personas que ejecutan un par de agentes gastarán $200-400/mes en tokens de API, aproximadamente el precio de un plan Max. - Cambiar de proveedor: OpenClaw no está atado a Claude. Puedes ejecutarlo con OpenAI, Gemini, Kimi o modelos de código abierto a través de Ollama. Claude sigue siendo fuerte, pero Anthropic está restringiendo el acceso. Otros son más amigables con los agentes, especialmente OpenAI y actores como Minimax que ya están construyendo para integraciones.
- Usar enrutamiento inteligente: En lugar de elegir un modelo y enviarle todo, Manifest enruta cada solicitud al modelo correcto automáticamente. Las indicaciones simples van a Haiku. Las tareas complejas van a Sonnet. Cada tarea obtiene el modelo más barato que pueda manejarla. En la práctica, si gastas $200–400/mes usando una clave API, el enrutamiento generalmente reduce eso a alrededor de $60–120. La misma idea en el plan Max: en lugar de acumular uso sobre tu suscripción, lo mantienes bajo control.
Qué hacer ahora mismo
Anthropic está ofreciendo créditos de API gratuitos a usuarios de suscripción elegibles. Entre $20 y $200 dependiendo de tu cuenta. Tienes hasta el 17 de abril para reclamarlos.
Así es como puedes obtenerlos y comenzar a enrutar:
- Ve a app.manifest.build y configura tu agente si aún no lo has hecho
- Haz clic en la pestaña Routers, luego "Add a router"
- Dentro del router, haz clic en "Add a provider" y desde la pestaña Subscription, selecciona Anthropic
- Verás un botón para reclamar tus créditos de Claude. Haz clic en él. Te llevará a una página de Anthropic donde puedes reclamarlos. Si obtienes un 404, tu cuenta no es elegible
- Regresa a Manifest con el modal aún abierto
- Conecta tu suscripción de Anthropic ejecutando
claude setup-tokenen tu terminal - Se abre una pestaña de Claude en tu navegador. Autorízala y cierra la pestaña.
- Aparece un token en tu terminal. Cópialo, pégalo en Manifest en el campo "Setup Token", haz clic en Connect
- Manifest preselecciona los mejores modelos para cada nivel. Puedes ajustarlos si lo deseas
📖 Read the full source: r/clawdbot
👀 Ver también

Predicción Multi-Token MTP: Generación de Tokens 2x Más Rápida en AMD Strix Halo y Radeon 9700 AI Pro
MTP acelera la inferencia de LLM hasta 2x, especialmente para agentes de código. El video cubre la mecánica de MTP y el rendimiento en Qwen 3.6 con AMD Strix Halo y Dual Radeon 9700.

Brecha en la Gobernanza del Comportamiento de Agentes de IA Expuesta por el Incidente del Correo de Summer Yue
Summer Yue, directora de alineación de IA de Meta, conectó OpenClaw a su bandeja de entrada del trabajo, y el agente eliminó más de 200 correos debido a la compresión de contexto durante la tarea, olvidando las instrucciones de seguridad. Las soluciones actuales se centran en restricciones de capacidad en lugar de la evaluación del comportamiento en tiempo real.

Bench de caché KV de Qwen 3.6-35B-A3B: f16 vs q8_0 vs Turbo3 vs Turbo4 en M5 Max hasta 1M de contexto
Los puntos de referencia del fork TurboQuant Metal de TheTom en M5 Max muestran que f16 y q8_0 se quedan sin memoria (OOM) más allá de 256K, mientras que turbo3 alcanza 1M a 6.5 tok/s de decodificación. La división de prefill y decodificación favorece a turbo3 para prefill y a turbo4 para decodificación en contextos largos.

Los modelos Bonsai 1-bit Qwen de PrismML probados: 107 t/s de generación con 8 GB de VRAM.
Los modelos Bonsai de PrismML son versiones cuantizadas de 1 bit de Qwen3 8B, 4B y 1.7B que logran una generación de 107 tokens/segundo y un procesamiento de prompts de >1114 t/s en una RTX 4060 con 8GB de VRAM, con requisitos de memoria significativamente reducidos.