AGENTS.md Feito Corretamente: Um Aumento de 25% na Precisão — ou uma Queda de 30%

✍️ OpenClawRadar📅 Publicado: April 28, 2026🔗 Source
AGENTS.md Feito Corretamente: Um Aumento de 25% na Precisão — ou uma Queda de 30%
Ad

A Augment Code realizou um estudo sistemático sobre arquivos AGENTS.md em seu monorepo. Os melhores arquivos deram ao seu agente de codificação um salto de qualidade equivalente a atualizar de Haiku para Opus; os piores tornaram a saída pior do que não ter nenhum AGENTS.md. O mesmo arquivo aumentou best_practices em 25% em uma correção de bug rotineira e reduziu completeness em 30% em uma tarefa complexa de funcionalidade no mesmo módulo. Veja o que funciona.

Como Eles Mediram

Eles usaram o AuggieBench, um conjunto de avaliação interno. Começaram com PRs de alta qualidade de um repositório grande que refletem tarefas típicas do dia a dia do agente, configuraram o ambiente e o prompt, e pediram ao agente para reproduzir o PR. Compararam a saída com o PR dourado (a versão que foi aprovada após revisão por vários engenheiros seniores). Os PRs tinham que estar contidos em um único módulo ou aplicativo, e o escopo precisava ser algo onde um AGENTS.md pudesse plausivelmente ajudar. Cada tarefa foi executada duas vezes — com e sem o arquivo.

Ad

O Que Funciona

1. Divulgação Progressiva > Cobertura Abrangente

Cubra casos comuns e fluxos de trabalho em alto nível; empurre detalhes para arquivos de referência que o agente pode carregar sob demanda. Mantenha o escopo de cada referência claro. Arquivos de 100 a 150 linhas com alguns documentos de referência focados proporcionaram melhorias de 10 a 15% nas métricas em módulos de médio porte (~100 arquivos principais). Acima desse comprimento, os ganhos se reverteram.

2. Fluxos de Trabalho Procedurais

Um fluxo de trabalho numerado de várias etapas pode fazer o agente passar de falha para conclusão. Exemplo: um fluxo de trabalho de seis etapas para implantar uma nova integração. Arquivos de conexão ausentes caíram de 40% para 10%, o agente terminou mais rápido, a correção aumentou 25%, a completeza aumentou 20%. Mantenha o arquivo principal conciso e use arquivos de referência para casos de ramificação.

3. Tabelas de Decisão

Quando duas ou três maneiras razoáveis existem (por exemplo, React Query vs Zustand para gerenciamento de estado), force a escolha antecipadamente com uma tabela. Exemplo:

Pergunta → React Query → Zustand
O servidor é a única fonte de dados? ✅
Múltiplos caminhos de código alteram esse estado? ✅
Precisa de atualizações otimistas misturadas com estado local? ✅

PRs nessa área pontuaram 25% mais alto em best_practices.

4. Exemplos Curtos de Produção

Snippets de 3 a 10 linhas do código de produção real melhoraram a reutilização e a adesão a padrões. Exemplo: modelos de copiar-colar para primitivas do Redux Toolkit (createSlice com estado inicial tipado, createAsyncThunk com tratamento de erros, useAppSelector tipado). code_reuse subiu 20%.

5. Regras Específicas de Domínio

Ainda importam — o padrão que a maioria das pessoas já associa ao AGENTS.md.

📖 Leia a fonte completa: HN AI Agents

Ad

👀 See Also

Quatro Erros Comuns de Configuração Que Fazem as Pessoas Desistir do OpenClaw
Guides

Quatro Erros Comuns de Configuração Que Fazem as Pessoas Desistir do OpenClaw

Um usuário do Reddit relata ter visto mais de 50 pessoas desistirem do OpenClaw devido a quatro problemas específicos de configuração: arquivos SOUL.md ausentes, custos excessivos de API por usar o modelo Opus para tudo, instalação de muitas habilidades de uma vez e criação de múltiplos agentes antes que o primeiro funcione corretamente.

OpenClawRadar
Guia prático de configuração e instalação para o agente de IA auto-hospedado OpenClaw
Guides

Guia prático de configuração e instalação para o agente de IA auto-hospedado OpenClaw

OpenClaw é um agente de IA auto-hospedado que se integra a aplicativos de mensagens e mantém memória persistente através de um sistema baseado em arquivos. Recomendações importantes de configuração incluem começar com a interface de terminal, conectar apenas um canal de mensagens inicialmente e configurar adequadamente o arquivo SOUL.md para personalidade e regras de segurança.

OpenClawRadar
Padrões de Falhas do OpenClaw: 42 Incidentes Reais em 28 Dias
Guides

Padrões de Falhas do OpenClaw: 42 Incidentes Reais em 28 Dias

Um desenvolvedor que executou o OpenClaw diariamente documentou 42 falhas específicas em oito categorias, incluindo alucinações de IA, falhas de autenticação e automações que custam mais tempo do que economizam. A fonte fornece exemplos concretos como a expiração de tokens OAuth do Google em 7 dias e o Opus 4.6 adicionando metadados indesejados aos arquivos.

OpenClawRadar
Rodando Qwen3.6-35B-A3B com ~190k de Contexto em 8GB VRAM + 32GB RAM – Configuração e Benchmarks
Guides

Rodando Qwen3.6-35B-A3B com ~190k de Contexto em 8GB VRAM + 32GB RAM – Configuração e Benchmarks

Um usuário do Reddit compartilha uma configuração funcional do llama.cpp para modelos Qwen3.6-35B-A3B GGUF em uma RTX 4060 (8GB VRAM) + 32GB DDR5, alcançando 37-51 tok/s em contexto de 192k usando TurboQuant e flags específicas.

OpenClawRadar