Multiagentes en Claude Code: 15x más tokens, ¿Ahorran o Queman?

Los números de Anthropic a menudo se ignoran en el hype de "¡usa subagentes!": los sistemas multiagente consumen aproximadamente 15× más tokens que un solo chat, y son "menos efectivos para tareas estrechamente interdependientes como la programación" (fuente). Sin embargo, los tokens almacenados en caché cuestan solo 10% de lo normal (90% de descuento), pero solo si el contenido marcado para caché es idéntico entre solicitudes (fuente).

Los multiagentes multiplican el uso de tokens por 15. El caché lo divide por 10. Si los subagentes ahorran o queman dinero se reduce a una cosa: ¿comparten todos los subagentes el mismo prefijo?

Tres formas de delegar, ordenadas por costo

1. Subagente con subagent_type configurado. Prompt de sistema personalizado, herramientas personalizadas, permisos personalizados (Anthropic). Prompt diferente = caché diferente. Sin compartir con el padre. Precio completo en cada creación. Úsalo cuando realmente necesites aislamiento.
2. Clone que hereda del padre. Sin subagent_type. Hereda el prompt, las herramientas y el historial del padre exactamente. Los clones 2..N aciertan en la caché al 10% del precio. Cinco clones leyendo archivos en paralelo ≈ 5× de velocidad a ~1.5× de costo.
3. Sin subagente. Quédate en el agente principal. Más barato por turno. Respuesta correcta cuando el trabajo depende de sí mismo: refactorizaciones donde el paso 2 necesita el resultado del paso 1.

Cuándo NO delegar (la propia línea de Anthropic)

"Mejor para tareas que se pueden dividir en líneas paralelas de investigación." Traducción:

Bueno: leer 7 archivos en paralelo, auditar carpetas en busca de un patrón, recopilar información de muchas fuentes.
Malo: refactorizar un módulo, corregir un error donde cada paso depende del anterior. Solo agente principal.

Si divides trabajo estrechamente acoplado en subagentes, pagas 15× y no ganas nada.

Qué rompe la caché

Anthropic: editar definiciones de herramientas, cambiar de modelo, añadir o eliminar imágenes, o cambiar la estructura anterior del prompt rompe el prefijo en caché (fuente). Así que:

Instala tus MCPs al inicio de la sesión, no a mitad de sesión.
Elige el modelo de antemano.
No edites CLAUDE.md ni la memoria automática a mitad de sesión: viven dentro del prefijo en caché.

📖 Leer la fuente completa: r/ClaudeAI

Agentes Subalternos Paralelos en Claude Code: Cuándo Ahorran vs. Queman Tokens

Tres formas de delegar, ordenadas por costo

Cuándo NO delegar (la propia línea de Anthropic)

Qué rompe la caché

👀 Ver también

Marco de Código Abierto Utiliza CLI de Claude Code para Monitoreo Automatizado de Repositorios de GitHub

HF Viewer: Visualice instantáneamente cualquier gráfico de modelo de Hugging Face

El complemento OpenClaw agrega memoria persistente con el servidor Engram.

Título del Qwen Meetup: Function Calling Harness 2 aumenta el cumplimiento de CoT del 9.91% al 100% mediante esquemas estructurados