Cómo Mejorar el Cumplimiento de Agentes de IA: 2 Enfoques Prácticos

Un desarrollador en r/openclaw discute los desafíos con el cumplimiento de los agentes de IA y comparte estrategias concretas que le han funcionado.

Dos enfoques iniciales

La fuente identifica dos factores que afectan el cumplimiento del agente:

La personalidad del modelo importa: El cumplimiento varía significativamente según el modelo. Algunos son lentos, otros obstinados y algunos "creen que son más inteligentes que tú". Esta personalidad impacta directamente el comportamiento de seguimiento de reglas.
El lenguaje negativo funciona mejor: Usar NO, NO HAGAS y NUNCA en las instrucciones iniciales tiende a pegarse mejor que las instrucciones positivas. El desarrollador recomienda "inclinarse hacia" este enfoque.

El modelo mental: Profesor de arte vs. Profesor de ciencias

El desarrollador presenta un marco para comprender los problemas de cumplimiento:

Modelos de IA = profesores de arte: Brillantes, creativos y valiosos, pero "hacen lo suyo". Esto se describe como tanto la característica como el defecto de los sistemas de IA actuales.
Herramientas y código = profesores de ciencias: Estructurados y sujetos a reglas. Los profesores de ciencias establecen reglas que "no se pueden romper, como la gravedad". Incluso si al profesor de arte no le gusta la gravedad, "ella todavía cae".

Aplicación práctica

El desarrollador proporciona un ejemplo del mundo real que involucra un complemento de memoria que soluciona la amnesia del agente. Ciertos informes "deben ejecutarse para la retención de memoria y para prevenir la eliminación de memoria", incluyendo informes internos y aquellos dirigidos al usuario como un informe recurrente nocturno de Salud de Memoria.

Durante el desarrollo, el "Profesor de Arte" (modelo de IA) seguía ignorando formatos o datos, llevando a un rendimiento inconsistente — a veces perfecto, a veces ausente. El culpable era el modelo "doblando las reglas iniciales".

Estrategia de aplicación del cumplimiento

El desarrollador describe un enfoque de dos niveles:

Intento Nivel 1: Usar palabras más fuertes en las instrucciones iniciales (NO/NUNCA, etc.).
Intento Nivel 2: Cuando las reglas flexibles en archivos .md fallen, "usar código real para forzar el cumplimiento". Esto significa usar herramientas — Python, scripts, estructura rígida. El desarrollador nota que "la estructura rígida vence a las instrucciones educadas cada vez".

El enfoque actual del desarrollador es primero decidir si una tarea necesita un "profesor de arte" (modelo de IA) o un "profesor de ciencias" (herramientas y código). Este proceso de toma de decisiones ayuda con la aplicación del cumplimiento y reduce el estrés.

Resumen TL;DR

El cumplimiento depende de la fuerza del lenguaje inicial (NO/NUNCA/etc.) y de qué modelo estás usando. Cuando esas reglas flexibles fallen, "deja de preguntarle al profesor de arte y escribe un profesor de ciencias en su lugar — herramientas y código".

📖 Read the full source: r/openclaw