Como Impor Conformidade em Agentes de IA: 2 Abordagens Práticas

Um desenvolvedor no r/openclaw discute os desafios com a conformidade de agentes de IA e compartilha estratégias concretas que funcionaram para ele.

Duas Abordagens Iniciais

A fonte identifica dois fatores que afetam a conformidade do agente:

A personalidade do modelo importa: A conformidade varia significativamente de acordo com o modelo. Alguns são lentos, alguns teimosos e alguns "acham que são mais espertos que você". Essa personalidade impacta diretamente o comportamento de seguir regras.
Linguagem negativa funciona melhor: Usar NÃO, NÃO FAÇA e NUNCA nas instruções iniciais tende a fixar melhor do que instruções positivas. O desenvolvedor recomenda "investir" nessa abordagem.

O Modelo Mental: Professor de Arte vs. Professor de Ciências

O desenvolvedor apresenta uma estrutura para entender os problemas de conformidade:

Modelos de IA = professores de arte: Brilhantes, criativos e valiosos, mas eles "fazem suas próprias coisas". Isso é descrito como tanto a característica quanto o defeito dos sistemas atuais de IA.
Ferramentas e código = professores de ciências: Estruturados e limitados por regras. Os professores de ciências estabelecem regras que "não podem ser quebradas — como a gravidade". Mesmo que o professor de arte não goste da gravidade, "ela ainda cai".

Aplicação Prática

O desenvolvedor fornece um exemplo do mundo real envolvendo um plugin de memória que corrige a amnésia do agente. Certos relatórios "devem ser executados para retenção de memória e para evitar exclusão de memória", incluindo relatórios internos e voltados para o usuário, como um relatório noturno recorrente de Saúde da Memória.

Durante o desenvolvimento, o "Professor de Arte" (modelo de IA) continuou ignorando formatos ou dados, levando a um desempenho inconsistente — às vezes perfeito, às vezes ausente. O culpado foi o modelo "dobrando as regras iniciais".

Estratégia de Aplicação de Conformidade

O desenvolvedor descreve uma abordagem de dois níveis:

Tentar Nível 1: Use palavras mais fortes nas instruções iniciais (NÃO/NUNCA, etc.).
Tentar Nível 2: Quando as regras flexíveis em arquivos .md falharem, "use código real para forçar a conformidade". Isso significa usar ferramentas — Python, scripts, estrutura rígida. O desenvolvedor observa que "estrutura rígida vence instruções educadas todas as vezes".

A abordagem atual do desenvolvedor é primeiro decidir se uma tarefa precisa de um "professor de arte" (modelo de IA) ou de um "professor de ciências" (ferramentas e código). Esse processo de tomada de decisão ajuda na aplicação da conformidade e reduz o estresse.

Resumo TL;DR

A conformidade depende da força da linguagem inicial (NÃO/NUNCA/etc.) e de qual modelo você está usando. Quando essas regras flexíveis falham, "pare de pedir ao professor de arte e escreva um professor de ciências em vez disso — ferramentas e código".

📖 Leia a fonte completa: r/openclaw