Bom Desenvolvimento Assistido por IA Acontece no Nível de Sistemas, Não no Nível de Tarefas

Um post no Reddit do usuário u/johns10davenport argumenta que a verdadeira alavancagem no desenvolvimento assistido por IA vem de mudar o sistema, não de melhorar os prompts. O autor relata uma frustração comum: toda vez que adiciona um novo recurso ao seu aplicativo Phoenix, o agente de codificação de IA entrega o recurso, mas omite o item de menu. A página existe, a funcionalidade funciona, mas não há como o usuário chegar lá.
O Problema da Correção no Nível da Tarefa
O primeiro instinto é dizer ao modelo: "adicione o botão". Isso funciona, mas o humano ainda está pensando — diagnosticando o problema e prescrevendo a solução. O autor chama isso de "pedalar o Peloton para que a Anthropic me dê tokens grátis". Engenharia de prompt só faz você melhor em dizer ao modelo o que fazer, mas você ainda está trabalhando para o modelo.
A Mudança no Nível do Sistema
Em vez de corrigir o botão ausente, o autor perguntou: como tornar esse erro impossível no futuro? A solução deles usa especificações BDD e auxiliares de teste do Phoenix LiveView. A função navigate do framework de teste permite que o agente pule diretamente para qualquer página, passando nos testes sem nunca tocar na interface. Então eles escreveram uma regra de linter que impede o agente de chamar navigate. Agora existe uma fixture permitida que coloca o teste em uma rota inicial conhecida, e a única maneira do agente alcançar o novo recurso é clicando pela interface — o que o força a adicionar o item de menu para fazer o teste passar.
O resultado: o problema nunca mais ocorrerá, não por causa de um prompt melhor, mas porque o comportamento correto é o único comportamento possível.
Conclusão Principal
Pare de corrigir a saída do modelo. Comece a restringir o ambiente dele para que a saída correta seja o caminho de menor resistência. Cada erro é uma oportunidade de projetar para eliminar o próximo.
📖 Leia a fonte completa: r/ClaudeAI
👀 See Also

Executando um Agente de IA Totalmente Local em um Laptop com 6 GB de VRAM: Um Guia Passo a Passo para Estudantes
Descubra como os estudantes podem aproveitar laptops com 6GB de VRAM para executar agentes de IA localmente, sem depender de APIs caras. Nosso guia detalha etapas e ferramentas essenciais.

Dicas de Uso de Token para Claude Code
Dicas práticas de um post no Reddit para reduzir o consumo de tokens: inicie novos chats, agrupe perguntas, mantenha CLAUDE.md enxuto, seja preciso com referências a arquivos, resuma e reinicie threads, e use modelos mais leves para tarefas simples.

Executando MiniMax M2.7 Q8_0 128K em 2x3090 com Offloading de CPU – Benchmarks e Configurações do Mundo Real
Um usuário executa com sucesso o MiniMax M2.7 em Q8_0 com 128K de contexto em duas RTX 3090 mais RAM DDR4, alcançando ~50 tps no processamento de prompt e ~10 tps na geração de tokens, e compartilha suas flags do llama-server.

Relatório de Campo: Qwen 3.6 27B em um MacBook Pro M2 (32GB) – Dolorosamente Lento, mas Resposta Inteligente
Executando o Qwen 3.6 27B IQ4_XS em um MacBook Pro M2 com 32 GB de RAM, obtém-se 7,9 t/s inicialmente, degradando para 3,1 t/s com 52k de contexto. A qualidade do código impressiona, mas a largura de banda da memória é o gargalo.