O volume de código gerado por IA está sobrecarregando engenheiros seniores, mostra estudo

O gargalo cognitivo do desenvolvimento assistido por IA
O cérebro humano processa pensamentos conscientes e analíticos a aproximadamente 10 bits por segundo, de acordo com uma pesquisa de 2025 publicada na Neuron. A memória de trabalho mantém aproximadamente 4 blocos de informação por vez. Essa limitação biológica cria uma incompatibilidade fundamental com a saída de código gerada por IA.
Quantificando o aumento da carga de trabalho
O Octoverse 2025 do GitHub mostra 43,2 milhões de pull requests mesclados por mês, um aumento de 23% em relação ao ano anterior. As linhas de código por desenvolvedor cresceram de 4.450 para 7.839 em oito meses - um aumento de 76%. A Faros AI analisou mais de 10.000 desenvolvedores e descobriu que os usuários de IA mesclam 98% mais pull requests com assistência de IA.
O estudo SmartBear/Cisco estabeleceu que a detecção de defeitos cai de 87% para PRs com menos de 100 linhas para 28% para PRs com mais de 1.000 linhas. A qualidade colapsa após 60 minutos de revisão. Um mantenedor do OCaml rejeitou um PR gerado por IA de 13.000 linhas devido a restrições de largura de banda.
Esgotamento e expansão da carga de trabalho
O Upwork Research Institute descobriu que 77% dos funcionários que usam IA dizem que ela aumentou sua carga de trabalho, não a reduziu. 71% relatam esgotamento. A descoberta mais preocupante: taxa de esgotamento de 88% entre os usuários de IA "mais produtivos", que têm o dobro de probabilidade de desistir.
Pesquisadores da UC Berkeley identificaram três mecanismos de "expansão da carga de trabalho": expansão de tarefas (o escopo de todos aumenta porque a IA torna possível fazer mais), limites borrados (o prompt de IA acontece durante o almoço, deslocamento, noites) e pressão implícita (quando colegas visivelmente fazem mais com IA, as expectativas aumentam para todos).
Por que a experiência torna o problema pior
A Microsoft Research confirmou em 2024 que os sistemas de IA podem tornar tarefas difíceis ainda mais difíceis, deixando os usuários com a mesma ou maior carga cognitiva. O mecanismo é assimétrico: ao escrever código, os desenvolvedores externalizam um modelo mental que já existe, mas ao revisar código gerado por IA, eles devem reverter o raciocínio a partir de um artefato produzido por um sistema que não tem compreensão do contexto de negócios.
Uma pesquisa da Clutch com 800 profissionais de software descobriu que 59% dos desenvolvedores usam código gerado por IA que não entendem completamente. Engenheiros seniores relatam a menor confiança nesse ambiente.
📖 Leia a fonte completa: HN AI Agents
👀 See Also

GLM-5.1 Lançado com Desempenho em Codificação Equivalente ao Claude Opus 4.5
O modelo GLM-5.1 da Zhipu AI agora está disponível para todos os usuários do Coding Plan, alcançando 77,8 pontos no SWE-bench-Verified e 56,2 pontos no Terminal Bench 2.0. O modelo possui janela de contexto de 200K, saída máxima de 128K e 744B parâmetros com 40B ativados.

Anthropic dobra os limites de taxa do Claude Code e remove limitação de pico para planos pagos
Anthropic dobrou os limites de taxa de 5 horas para Claude Code nos planos Pro, Max, Team e Enterprise, removeu a limitação de horário de pico e aumentou os limites de taxa da API para modelos Opus.

A reescrita de 18 meses da base de código da Autonoma: lições sobre testes, dívida técnica e Server Actions
A Autonoma descartou 1,5 ano de código após escalar de 2 para 14 engenheiros, citando falta de testes, TypeScript não estrito e limitações das Server Actions como principais motivos para a reescrita.

Lacuna na Governança do Comportamento de Agentes de IA Exposta pelo Incidente do Email de Summer Yue
A diretora de alinhamento de IA da Meta, Summer Yue, conectou o OpenClaw à sua caixa de entrada de trabalho, e o agente excluiu mais de 200 e-mails devido à compressão de contexto durante a tarefa, esquecendo as instruções de segurança. As soluções atuais focam em restrições de capacidade em vez de avaliação de comportamento em tempo real.