Código Filtrado de Claude: 512K Líneas y Sistema KAIROS Revelados

Lo que Reveló la Filtración

Anthropic envió accidentalmente un mapa de fuente en su paquete npm, exponiendo toda la base de código de Claude Code. La filtración contiene 512 mil líneas de TypeScript, 44 banderas de características y un sistema oculto llamado KAIROS.

KAIROS se describe como un agente en segundo plano siempre activo que realiza varias funciones mientras el usuario está inactivo:

Consolida la memoria
Fusiona observaciones
Elimina contradicciones
Prepara el contexto para que esté limpio cuando el usuario regrese

La Experiencia de Desarrollo Independiente

Un desarrollador solitario que construía una plataforma de TypeScript de 668 mil líneas con Claude Code encontró las mismas limitaciones que KAIROS aborda. Ejecutan campañas autónomas que abarcan múltiples sesiones con archivos de estado persistentes que transportan el contexto más allá de los límites de la ventana de contexto.

El problema: las campañas se estancan entre sesiones. Al finalizar una fase y regresar más tarde, los desarrolladores deben reiniciar manualmente, releer los archivos de campaña y averiguar dónde se quedaron las cosas porque la memoria del agente muere con la sesión.

La solución que construyeron: un demonio que encadena sesiones mediante desencadenadores programados. Una sesión finaliza, escribe el estado, sale con código 0 ("sin errores") y el demonio detecta la salida para generar la siguiente sesión con contexto completo. Esto redujo campañas que tomaban una semana de reinicios manuales para completarse de una sola vez.

El Problema de Verificación

El desarrollador descubrió que el código de salida 0 significa "sin errores" pero no significa "funciona". En su primera noche ejecutando el demonio, un agente envió una característica invisible: una campaña completa se completó con verificación de tipos limpia, cero advertencias y salida confiada, pero 37 de 38 entidades faltaban en la aplicación real.

En otro caso, una sesión de flota reemplazó 6 componentes funcionales en paralelo, resultando en componentes que mostraban "Ejecutando NaN" sin línea de tiempo ni signos vitales. Los agentes nunca representaron lo que construyeron; solo verificaron que se compiló y continuaron.

La Solución de Capa de Verificación

El desarrollador se dio cuenta de que "el demonio solo es una forma más rápida de enviar código roto". Construyeron una capa de verificación que obliga a los agentes a demostrar su trabajo visualmente:

Navegar rutas reales en un navegador real
Contar elementos DOM
Capturar capturas de pantalla
Si una vista que debería tener 38 tarjetas de entidades tiene cero, el sistema lo detecta
Si un agente modificó archivos de interfaz de usuario, no puede completarse sin artefactos de captura de pantalla

Esto se implementa como una puerta dura, no como una sugerencia.

La Brecha Fundamental

KAIROS resuelve el problema de memoria pero no resuelve el problema de verificación. Aunque fusiona observaciones, elimina contradicciones y convierte percepciones vagas en hechos concretos, ni la consolidación de memoria ni el modo demonio abordan la brecha fundamental: los agentes no pueden verificar su propio trabajo visualmente. Pueden demostrar estructura pero no pueden demostrar apariencia.

El desarrollador señala que la convergencia entre KAIROS de Anthropic y su solución independiente indica un límite real: una vez que las sesiones son lo suficientemente largas y las campañas abarcan días, la ejecución en segundo plano persistente se vuelve inevitable. Sin embargo, "el demonio es la parte fácil. Cualquiera puede encadenar sesiones. La parte difícil es construir la infraestructura que detecta los fallos que el demonio enviará con confianza".

Conclusión Clave

Si estás construyendo cualquier forma de ejecución autónoma de agentes, haz una pregunta antes de enviar: ¿puede mi agente demostrar que lo que construyó realmente funciona? Si la respuesta es "se compiló", es probable que encuentres los mismos problemas. Las 27 autopsias documentadas del desarrollador les enseñaron que "el demonio es un multiplicador de fuerza. Sin una capa de calidad, multiplica tus fallos".

El demonio, la capa de verificación y el sistema de persistencia de campañas son de código abierto en github.com/SethGammon/Citadel.

📖 Leer la fuente completa: r/ClaudeAI

Código Filtrado de Claude Revela el Sistema KAIROS y la Brecha de Verificación en Agentes de IA

Lo que Reveló la Filtración

La Experiencia de Desarrollo Independiente

El Problema de Verificación

La Solución de Capa de Verificación

La Brecha Fundamental

Conclusión Clave

👀 Ver también

Se proyecta que los costos de entrenamiento de OpenAI superen los de Anthropic en 4 a 5 veces anualmente.

Eficiencia de Tokens en Opus 4.7: Los Prompts en Alemán Consumen Hasta el Doble de Tokens que en Inglés

DeepSeek retiene su último modelo de IA de Nvidia y AMD

Claude Code v2.1.195: Corrección del emparejador de hooks, variable de entorno para desactivar el ratón, correcciones de dictado por voz