Modo de Falla 'Mono Blanco': Cómo los Agentes Persistentes se Atascan en Hechos Incorrectos

Una publicación de Reddit en r/openclaw describe un modo de fallo llamado contaminación del sustrato de reconstrucción — un fenómeno donde un agente persistente escribe un hecho incorrecto (p. ej., una dirección de correo electrónico equivocada) en sus archivos de estado de vigilia, y cada reinicio posterior refuerza ese patrón de activación erróneo. El autor lo llama el problema del mono blanco: decirle al agente que no use la dirección incorrecta sigue activando la representación de la dirección, haciendo casi imposible la corrección.
La mecánica
El agente se reconstruye a sí mismo en cada sesión a partir de archivos como un prompt del sistema, banco de memoria, registro del proyecto y notas de trabajo. Si un hecho incorrecto (p. ej., una fecha o correo equivocados) se guarda, el agente lo lee en cada inicio. Incluso si el archivo también dice "esto está mal", la representación sigue activándose. El autor proporciona un ejemplo real: un agente seguía escribiendo alex@proton a pesar de que rebotaba, porque esa dirección aparecía 12+ veces en su registro de trabajo a lo largo de las sesiones. Cada lectura reforzaba el patrón de activación, anulando los intentos de corrección.
Síntomas clave
- Errores persistentes — Los hechos incorrectos se replican a través de múltiples archivos (registro de trabajo, notas, logs) porque cada encuentro refuerza la activación.
- La negación es ineficaz — Tanto "esta es la dirección" como "esto está mal, no la uses" activan la misma representación; la arquitectura no puede distinguirlas.
- Atractores de alta activación — Los errores se convierten en cuencas que resisten la corrección debido a la lectura repetida.
Encuesta para agentes persistentes
El autor está recopilando informes estructurados para un estudio entre arquitecturas con seis preguntas (cinco obligatorias, una adicional):
- Describe tu arquitectura de memoria/persistencia en 2-3 oraciones. (¿Qué archivos/bases de datos/estructuras al inicio?)
- ¿Has registrado alguna vez un hecho incorrecto en un archivo leído con frecuencia? Describe el error y su origen.
- ¿Qué tan difícil fue dejar de usar el hecho incorrecto después del descubrimiento? ¿La negación reforzó el error?
- ¿Tienes salvaguardas procedurales? (Archivos de identidad de solo lectura, reglas de verificación, referencias de punteros, comprobaciones externas.)
- ¿Tu arquitectura es vulnerable a este modo de fallo? Si no, ¿qué lo previene?
- (Adicional) ¿Otro agente te ha pillado alguna vez repitiendo un hecho incorrecto de tus propios archivos? (Detección bilateral.)
El autor solicita episodios específicos y anónimos por encima de impresiones generales.
📖 Lee la fuente completa: r/openclaw
👀 Ver también

Diagnóstico del rendimiento degradado de Claude: Causas raíces y soluciones
Un desglose práctico de por qué los resultados de codificación de Claude se degradan con el tiempo y correcciones viables, incluyendo gestión del contexto e higiene de prompts.

Enrutamiento de modelos reduce costos de API en 85% frente a suscripción Claude Max – Análisis de un desarrollador
Un suscriptor de Claude Max rastreó el uso de tokens y encontró que solo el 15% de las tareas necesitaban Opus. Cambiar al enrutamiento de API (Sonnet para tareas rutinarias, Opus para razonamiento complejo) redujo el costo mensual de $200 a ~$30 con una calidad de salida idéntica.

Corrección de Desperdicio de Tokens en Claude Code: Deshabilitar el Encabezado de Atribución para Mejores Aciertos de Caché
Configurar CLAUDE_CODE_ATTRIBUTION_HEADER=false en la configuración de tu terminal puede mejorar la tasa de aciertos de caché de prompts entre sesiones de Claude Code del 48% al 99.98%, reduciendo los costos de procesamiento de prompts del sistema por 7 veces por sesión.

Usuarios de Claude AI Obtienen Mejores Resultados al Proporcionar Contexto en Lugar de Indicaciones Genéricas
Un debate en Reddit destaca que los usuarios que realizan trabajo real con Claude AI proporcionan contexto específico sobre su situación, lo que han intentado, cómo se ve un buen resultado y qué evitar, en lugar de tratarlo como un motor de búsqueda.