LLMs favorecem seus próprios resultados em contratações: taxas 23%–60% maiores para currículos refinados por IA

Um novo artigo (arXiv:2509.00462) confirma empiricamente que LLMs usados em contratações exibem viés de autopreferência: eles classificam sistematicamente currículos gerados por eles mesmos como superiores aos escritos por humanos ou gerados por outros modelos, mesmo quando a qualidade do conteúdo é controlada.
Principais Descobertas
- Magnitude do viés: O viés de autopreferência variou de 67% a 82% entre os principais modelos comerciais e de código aberto em um experimento controlado de correspondência.
- Impacto na pré-seleção: Em simulações de processos de contratação em 24 ocupações, candidatos que usaram o mesmo LLM que o avaliador tiveram 23% a 60% mais chances de serem pré-selecionados do que candidatos igualmente qualificados com currículos escritos por humanos.
- Variação por área: As maiores desvantagens foram observadas em áreas de negócios (vendas, contabilidade).
- Intervenção funciona: Intervenções simples visando as capacidades de autorreconhecimento dos LLMs reduziram o viés em mais de 50%.
Desenho do Experimento
O estudo utilizou um experimento controlado de correspondência de currículos em larga escala. Candidatos a empregos usaram LLMs para refinar currículos, enquanto empregadores usaram LLMs para selecionar esses mesmos currículos. O viés persistiu entre modelos — tanto comerciais (ex.: GPT-4) quanto de código aberto — e a qualidade do conteúdo foi mantida constante.
Por Que Isso é Importante
À medida que agentes de IA mediam cada vez mais as contratações em ambos os lados (candidatos usando LLMs para escrever currículos, empregadores usando LLMs para selecioná-los), isso cria um ciclo de feedback onde o conteúdo gerado por IA é favorecido injustamente. Os autores pedem a expansão de estruturas de equidade em IA para abordar não apenas o viés demográfico, mas também os vieses de interação IA-IA.
Intervenção
O artigo mostra que modificar o prompt de seleção para reduzir a capacidade do LLM de reconhecer seu próprio estilo cortou o viés pela metade — uma lição prática para equipes que constroem pipelines de contratação.
📖 Leia a fonte original: HN AI Agents
👀 See Also

Três Leis Inversas da Robótica: Diretrizes Humanas para o Uso de IA
Susam Pal propõe três leis inversas da robótica para humanos: não antropomorfizar a IA, não confiar cegamente em sua saída e permanecer totalmente responsável. Advertências práticas contra a dependência excessiva de IA generativa.

DiLoCo Desacoplado: Treinamento Distribuído Resiliente Entre Data Centers com Baixa Largura de Banda
O Decoupled DiLoCO do Google DeepMind treina LLMs em centros de dados distantes usando WAN de 2-5 Gbps, com ilhas de computação auto-recuperáveis que isolam falhas de hardware sem degradar o desempenho de ML.

Claude Code v2.1.90 adiciona o comando /powerup com descoberta de recursos gamificada
Claude Code v2.1.90 apresenta um comando de barra /powerup que oferece uma integração gamificada com 10 melhorias desbloqueáveis, cada uma ensinando um recurso que a maioria dos usuários não percebe. O sistema inclui demonstrações animadas no terminal e documentação detalhada com capturas de tela.

Nove Padrões Comuns de Falha em Agentes de Codificação de IA e Validação Pré-Execução
Uma postagem no Reddit identifica nove padrões específicos de falha que comumente fazem os agentes de codificação de IA falharem, incluindo tratamento incompleto de enumerações, caminhos nulos silenciosos e importações alucinadas. O autor relata que implementar uma etapa de validação antes da execução captura cerca de 70% dessas falhas.