Utilizador do Reddit experimenta com agentes de programação que aprendem com falhas para quebrar ciclos de repetição

Um desenvolvedor no r/LocalLLaMA tem experimentado com agentes de programação que aprendem com falhas para sair de loops de tentativa repetitivos. A abordagem foca em tratar a falha como informação reutilizável em vez de apenas registrar erros brutos.
O Problema: Preso em Loops de Falha
O desenvolvedor observou que agentes de programação frequentemente ficam presos em padrões de falha: falha → tentar novamente → falha novamente. Inicialmente pensado como uma limitação do modelo, o problema parece ser uma questão de tratamento de falhas onde os sistemas não rastreiam por que algo falhou. Ao tentar novamente, os agentes normalmente geram variações da mesma tentativa, repetindo os mesmos erros de maneiras ligeiramente diferentes.
A Abordagem Experimental
Em vez de manter registros brutos, o desenvolvedor começou a armazenar "causas raiz" simplificadas e emparelhá-las com correções que funcionaram anteriormente. Tentativas futuras então correspondem a esse conhecimento armazenado em vez de adivinhar novamente. O desenvolvedor observa que essa abordagem ainda é rudimentar, mas mostra comportamento diferente: o sistema não fica preso nos mesmos loops com tanta frequência e às vezes realmente converge em soluções.
Desafios Atuais
- Corresponder falhas de forma confiável é complicado
- Se o sistema generalizar a coisa errada, pode reforçar correções ruins
- Incerteza sobre como equilibrar reutilizar correções conhecidas versus explorar novas
O desenvolvedor está buscando contribuições da comunidade sobre essa abordagem e se outros tentaram métodos similares para melhorar a recuperação de falhas de agentes de programação.
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Seu Agente Disse que Enviou – Por Que os Rastreamentos de Sessão Importam Mais que os Nomes dos Modelos
Um desenvolvedor relata um padrão observado em três equipes de engenharia: agentes afirmam conclusão, mas rastros de sessão revelam refatorações ocultas, convenções ignoradas e implementações abaixo do ideal. O post argumenta que o verdadeiro problema não é a qualidade do modelo, mas a confiança – e que rastros de sessão por instância são a única maneira de verificar as afirmações.

Habilidade de Codificação Karpathy Reescrita para o Plano Gratuito, Libera Disciplina de Codificação Claude Sem Pro
Um usuário do Reddit adaptou as diretrizes de disciplina de codificação de Karpathy para o plano gratuito do Claude, removendo dependências de terminal e subagentes. O prompt do sistema é acionado automaticamente em solicitações de codificação e impõe uma abordagem de verificação antes de pensar.

Ferramenta Gratuita de Teste de Autenticação de Bot Web da Fingerprint para Desenvolvedores de Agentes de IA
A Fingerprint lançou um endpoint público e gratuito para testar implementações de Web Bot Auth. A ferramenta valida assinaturas criptográficas em requisições HTTP, ajudando desenvolvedores de bots e agentes de IA a garantir que sua configuração WBA funcione corretamente antes de ir para produção.

bareguard: Um Portão de Segurança Leve para Agentes de IA — Agora no npm
bareguard v1.0 é uma camada de segurança de ~1000 linhas e dependência única para agentes de IA que bloqueia ações destrutivas (rm -rf, DROP TABLE) e impõe limites de orçamento com escalonamento humano. Parte do bare suite, disponível no npm.