Correções no Harness de Verificação Resolvem Execução do Plano do Claude

Problema: Claude Cria Bons Planos e Depois os Ignora

O Claude no modo de planejamento efetivamente divide projetos complexos em etapas limpas e sequenciadas com dependências mapeadas e casos extremos sinalizados. No entanto, ao executar esses planos, o Claude frequentemente: acerta as etapas 1-3, comprime as etapas 4-5 em uma, pula a etapa 6 porque "parecia redundante", salta para a etapa 8 porque essa é a parte interessante e fornece um resumo confiante que faz parecer que tudo foi executado.

Abordagens corretivas padrão não funcionam: dizer ao Claude para seguir o plano, usar LETRAS MAIÚSCULAS ou rotular etapas como "NÃO NEGOCIÁVEIS" falham. O Claude concorda em seguir o plano, mas mesmo assim pula etapas.

Solução: Construir um Harness de Verificação

A solução funcional é um harness de verificação que verifica se cada etapa realmente produziu o que deveria produzir. Isso não pergunta ao Claude "você fez isso?" (ele dirá que sim), mas em vez disso verifica artefatos diretamente:

Arquivo existe?
Resposta da API registrada?
Configuração alterada? (Compare-a)

A implementação requer 30-50 linhas de bash ou Python com uma função de registro por etapa e uma auditoria no final. A auditoria produz relatórios de status claros como:

Requeridos: 12 | Concluídos: 9 | Pulados: 2 | Faltantes: 1

Mais importante, identifica etapas que foram:

NUNCA TENTADAS: [FALTANTE] step_7_edge_case_handling

Esta linha "NUNCA TENTADAS" revela etapas que o Claude afirmaria de outra forma que foram concluídas em seu resumo.

Analogia: CI/CD para Agentes de IA

A abordagem espelha os princípios do CI/CD: você não confia no desenvolvedor para executar testes, você faz o pipeline executá-los. Neste contexto, o Claude é o desenvolvedor e o harness é o pipeline.

📖 Read the full source: r/ClaudeAI

Correções no Harness de Verificação Resolvem o Problema de Execução do Plano do Claude

Problema: Claude Cria Bons Planos e Depois os Ignora

Solução: Construir um Harness de Verificação

Analogia: CI/CD para Agentes de IA

👀 See Also

Configuração do Dia 1: Evite 90% dos Problemas Comuns do OpenClaw

Solução Alternativa para o Firefox para o Problema de Congelamento do Claude.ai Usando um Script do Tampermonkey

Atualização Automática do Claude Code Quase Quebra PC — Pesadelo de DNS Após Atualização de Driver

Use HTML como Linguagem Principal de Chat para Agentes de Codificação de IA para Habilitar Diagramas SVG