Cómo Reducir la Deriva de Estado en Agentes IA Multipaso: 3 Técnicas

Identificando el problema

Al construir flujos de trabajo de múltiples pasos o multiagente, un problema común es que las cosas funcionan de forma aislada pero se rompen entre pasos. Los síntomas incluyen:

La misma entrada produce diferentes salidas entre ejecuciones
Los agentes "olvidan" decisiones anteriores
La depuración se vuelve casi imposible

Inicialmente, estos problemas se confundieron con problemas de prompt, aleatoriedad de temperatura o mala recuperación, pero la causa raíz era la deriva de estado.

Soluciones prácticas que funcionaron

Dejar de depender del "contexto más reciente"

La mayoría de las configuraciones hacen que el paso N lea cualquier contexto que exista en este momento. El problema es que el contexto es inestable, especialmente con pasos paralelos o actualizaciones asíncronas.

Introducir lecturas basadas en instantáneas

En lugar de leer el "estado más reciente", cada paso lee desde una instantánea fijada. Por ejemplo, el paso 3 no lee la "memoria actual", lee la instantánea v2 (fija). Esto hace que la ejecución sea determinista.

Hacer que las escrituras sean solo de anexo

En lugar de mutar la memoria compartida, cada paso escribe una nueva versión sin sobrescribir. Así, v2 → paso → produce v3, luego v3 → siguiente paso → produce v4. Esto permite:

Reproducir flujos
Depurar fallos exactos
Comparar ejecuciones

Separar "estado" vs "contexto"

Esta distinción fue crucial. Ahora tratamos:

Estado = estructurado, persistente (decisiones, salidas, variables)
Contexto = temporal (lo que el modelo ve por paso)

No mezclar los dos.

Mantener el estado mínimo + estructurado

En lugar de volcar todo el historial de chat, almacenar cosas como:

Objetivo
Paso actual
Salidas hasta ahora
Decisiones tomadas

Todo lo demás se deriva si es necesario.

Usar la temperatura estratégicamente

La temperatura no era el problema principal. Lo que funcionó mejor:

Temperatura baja (0–0.3) para pasos que cambian el estado
Temperatura más alta solo para pasos "creativos" finales

Resultados

Después de implementar estos cambios:

Las ejecuciones se volvieron reproducibles
La coordinación multiagente mejoró
La depuración pasó de ser conjeturas a ser rastreable

El autor pregunta cómo otros están manejando esto: reconstruyendo el estado desde el historial, usando recuperación vectorial, almacenando estado estructurado explícito, o algo más.

📖 Read the full source: r/LocalLLaMA