Código Filtrado de Claude Revela el Sistema KAIROS y la Brecha de Verificación en Agentes de IA

Lo que Reveló la Filtración
Anthropic envió accidentalmente un mapa de fuente en su paquete npm, exponiendo toda la base de código de Claude Code. La filtración contiene 512 mil líneas de TypeScript, 44 banderas de características y un sistema oculto llamado KAIROS.
KAIROS se describe como un agente en segundo plano siempre activo que realiza varias funciones mientras el usuario está inactivo:
- Consolida la memoria
- Fusiona observaciones
- Elimina contradicciones
- Prepara el contexto para que esté limpio cuando el usuario regrese
La Experiencia de Desarrollo Independiente
Un desarrollador solitario que construía una plataforma de TypeScript de 668 mil líneas con Claude Code encontró las mismas limitaciones que KAIROS aborda. Ejecutan campañas autónomas que abarcan múltiples sesiones con archivos de estado persistentes que transportan el contexto más allá de los límites de la ventana de contexto.
El problema: las campañas se estancan entre sesiones. Al finalizar una fase y regresar más tarde, los desarrolladores deben reiniciar manualmente, releer los archivos de campaña y averiguar dónde se quedaron las cosas porque la memoria del agente muere con la sesión.
La solución que construyeron: un demonio que encadena sesiones mediante desencadenadores programados. Una sesión finaliza, escribe el estado, sale con código 0 ("sin errores") y el demonio detecta la salida para generar la siguiente sesión con contexto completo. Esto redujo campañas que tomaban una semana de reinicios manuales para completarse de una sola vez.
El Problema de Verificación
El desarrollador descubrió que el código de salida 0 significa "sin errores" pero no significa "funciona". En su primera noche ejecutando el demonio, un agente envió una característica invisible: una campaña completa se completó con verificación de tipos limpia, cero advertencias y salida confiada, pero 37 de 38 entidades faltaban en la aplicación real.
En otro caso, una sesión de flota reemplazó 6 componentes funcionales en paralelo, resultando en componentes que mostraban "Ejecutando NaN" sin línea de tiempo ni signos vitales. Los agentes nunca representaron lo que construyeron; solo verificaron que se compiló y continuaron.
La Solución de Capa de Verificación
El desarrollador se dio cuenta de que "el demonio solo es una forma más rápida de enviar código roto". Construyeron una capa de verificación que obliga a los agentes a demostrar su trabajo visualmente:
- Navegar rutas reales en un navegador real
- Contar elementos DOM
- Capturar capturas de pantalla
- Si una vista que debería tener 38 tarjetas de entidades tiene cero, el sistema lo detecta
- Si un agente modificó archivos de interfaz de usuario, no puede completarse sin artefactos de captura de pantalla
Esto se implementa como una puerta dura, no como una sugerencia.
La Brecha Fundamental
KAIROS resuelve el problema de memoria pero no resuelve el problema de verificación. Aunque fusiona observaciones, elimina contradicciones y convierte percepciones vagas en hechos concretos, ni la consolidación de memoria ni el modo demonio abordan la brecha fundamental: los agentes no pueden verificar su propio trabajo visualmente. Pueden demostrar estructura pero no pueden demostrar apariencia.
El desarrollador señala que la convergencia entre KAIROS de Anthropic y su solución independiente indica un límite real: una vez que las sesiones son lo suficientemente largas y las campañas abarcan días, la ejecución en segundo plano persistente se vuelve inevitable. Sin embargo, "el demonio es la parte fácil. Cualquiera puede encadenar sesiones. La parte difícil es construir la infraestructura que detecta los fallos que el demonio enviará con confianza".
Conclusión Clave
Si estás construyendo cualquier forma de ejecución autónoma de agentes, haz una pregunta antes de enviar: ¿puede mi agente demostrar que lo que construyó realmente funciona? Si la respuesta es "se compiló", es probable que encuentres los mismos problemas. Las 27 autopsias documentadas del desarrollador les enseñaron que "el demonio es un multiplicador de fuerza. Sin una capa de calidad, multiplica tus fallos".
El demonio, la capa de verificación y el sistema de persistencia de campañas son de código abierto en github.com/SethGammon/Citadel.
📖 Leer la fuente completa: r/ClaudeAI
👀 Ver también

El usuario de OpenClaw reporta 143 millones de tokens procesados por $94 a través de OpenRouter.
Un usuario de Reddit que ejecuta pipelines de agentes múltiples OpenClaw procesó 143 millones de tokens por $94.16, logrando un costo de aproximadamente $0.66 por millón de tokens al enrutar a través de OpenRouter e implementar optimizaciones de configuración específicas.

Ejecutando OpenClawd de forma gratuita: Éxitos y desafíos
En una publicación reciente en r/clawdbot, un miembro comparte su experiencia utilizando OpenClawd sin claves de API, discutiendo sus éxitos y los desafíos enfrentados.

Proveedor OpenClaw Mistral Roto Desde la Actualización 2026.3.8, la Comunidad Busca Alternativas
Los usuarios de OpenClaw reportan errores persistentes HTTP 422 con los modelos Mistral desde la actualización 2026.3.8, sin correcciones en las versiones posteriores hasta la 2026.3.13. El problema afecta toda la funcionalidad relacionada con Mistral, mientras que las llamadas directas a la API funcionan con normalidad.

Las suscripciones de IA necesitan un medidor confiable: Un llamado a la transparencia del servicio
Un post de Reddit argumenta que las suscripciones de IA deberían proporcionar un recibo de servicio básico que muestre qué modelo se sirvió realmente, el esfuerzo de razonamiento, el manejo del contexto y cualquier gestión de carga, estableciendo paralelismos con las normas de pesos y medidas.