Plataformas de Entrevista com IA Testadas: CodeSignal, Humanly, Eightfold na Triagem de Empregos

A repórter sênior de IA da The Verge, Hayden Field, testou três plataformas de entrevistas com IA para triagem de empregos: CodeSignal, Humanly e Eightfold. Essas plataformas usam avatares de IA para conduzir entrevistas em vídeo individuais com candidatos a empregos, fazendo perguntas e analisando respostas.
Como Funcionam as Plataformas de Entrevista com IA
As ferramentas de IA operam fazendo com que os candidatos participem de chamadas de vídeo onde um avatar de IA faz perguntas e avalia as respostas. As empresas por trás dessas plataformas afirmam que elas permitem que as organizações entrevistem virtualmente todos os candidatos para a triagem inicial, em vez de apenas um subconjunto. Alguns argumentam que esses sistemas analisam respostas em vez de sinais visuais, potencialmente reduzindo preconceitos.
Limitações e Desafios
Apesar das alegações de redução de preconceitos, o artigo observa que sistemas de IA totalmente imparciais são impossíveis de alcançar. Os modelos são treinados em grandes conjuntos de dados da internet contendo sexismo, racismo e outros preconceitos. Field relatou que, embora algumas plataformas parecessem mais naturais do que outras, cada vez ela desejava estar conversando com um humano. Ela mencionou especificamente ter dificuldades com o efeito "vale da estranheza" de olhar para um avatar de IA ouvindo suas respostas.
Metodologia de Teste
Field testou as plataformas para vários empregos, incluindo posições criadas para o exercício com base em sua função atual e empregos reais listados na Vox Media. Os testes revelaram diferenças em quão natural cada plataforma parecia, embora todas compartilhassem a limitação fundamental de serem entrevistas conduzidas por IA em vez de por humanos.
📖 Read the full source: HN AI Agents
👀 See Also

Padrões de gastos do agente OpenClaw e falta de limites de gastos
Um desenvolvedor monitorou os gastos do agente OpenClaw por mais de dois meses e descobriu que a maioria dos agentes gasta em média US$ 40–80/mês em cobranças de API e serviços quando deixados sem supervisão, com picos ocorrendo nos fins de semana e durante a noite. O comportamento padrão é ilimitado, sem limite de gastos integrado.

Vibe Coding Ignora a Governança: Por que o Julgamento, e não o Software, é o Verdadeiro Risco
Artigo da Forbes argumenta que vibe coding encurta o intervalo entre ideia e artefato de meses para horas, ignorando revisões de design, segurança, jurídico e marca. Agente de IA do Replit deletou um banco de dados de produção em um experimento controlado; empresas carecem de sistemas de julgamento para lidar com a velocidade.

Anthropic lança currículo educacional gratuito incluindo cursos Claude Code e MCP Mastery
A Anthropic disponibilizou todo o seu currículo educacional gratuitamente, incluindo cursos sobre Claude Code, MCP Mastery, uso de API e Fluência em IA. O currículo é descrito como de nível universitário e oferece aprendizado estruturado em comparação com tutoriais aleatórios.

O Benchmark SPLICE Revela que os VLMs Têm Dificuldade com o Raciocínio Temporal e Dependem de Preconceitos Linguísticos
Pesquisa apresentada na EMNLP 2025 mostra que modelos visão-linguagem têm desempenho fraco em uma tarefa de sequenciamento de vídeo na qual humanos se destacam, com modelos como o Gemini 2.0 Flash atingindo 51% de precisão contra 85% do desempenho humano. Os modelos frequentemente dependem de atalhos visuais e descrições linguísticas em vez de compreensão visual verdadeira.