Plateformes d'entretien IA testées : CodeSignal, Humanly, Eightfold dans le filtrage des candidatures

La journaliste IA senior de The Verge, Hayden Field, a testé trois plateformes d'entretien d'embauche par IA : CodeSignal, Humanly et Eightfold. Ces plateformes utilisent des avatars IA pour mener des entretiens vidéo individuels avec les candidats, posant des questions et analysant les réponses.
Fonctionnement des plateformes d'entretien par IA
Les outils IA fonctionnent en faisant participer les candidats à des appels vidéo où un avatar IA pose des questions et évalue les réponses. Les entreprises derrière ces plateformes affirment qu'elles permettent aux organisations d'interviewer virtuellement chaque candidat pour le premier tri plutôt qu'un simple sous-ensemble. Certains soutiennent que ces systèmes analysent les réponses plutôt que les indices visuels, réduisant potentiellement les biais.
Limites et défis
Malgré les affirmations de réduction des biais, l'article note que des systèmes IA totalement exempts de biais sont impossibles à réaliser. Les modèles sont entraînés sur de vastes ensembles de données internet contenant du sexisme, du racisme et d'autres biais. Field a rapporté que si certaines plateformes semblaient plus naturelles que d'autres, à chaque fois, elle aurait préféré parler à un humain. Elle a notamment mentionné avoir lutté contre l'effet "vallée dérangeante" en regardant un avatar IA écouter ses réponses.
Méthodologie de test
Field a testé les plateformes pour divers emplois, y compris des postes créés pour l'exercice basés sur son rôle actuel et de vrais emplois listés chez Vox Media. Les tests ont révélé des différences dans le caractère naturel de chaque plateforme, bien que toutes partagent la limitation fondamentale d'être des entretiens menés par IA plutôt que par des humains.
📖 Read the full source: HN AI Agents
👀 See Also

Bench du cache KV Qwen 3.6-35B-A3B : f16 vs q8_0 vs Turbo3 vs Turbo4 sur M5 Max jusqu'à 1M de contexte
Les benchmarks du fork TurboQuant Metal de TheTom sur M5 Max montrent que f16 et q8_0 manquent de mémoire au-delà de 256K, tandis que turbo3 atteint 1M à 6,5 tok/s en décodage. La séparation préremplissage/décodage favorise turbo3 pour le préremplissage et turbo4 pour le décodage sur les longs contextes.

Anthropic paie 15 milliards de dollars par an à SpaceX pour du calcul jusqu'en 2029
Un dépôt en vue de l'introduction en bourse de SpaceX révèle qu'Anthropic paie 1,25 milliard $ par mois jusqu'en mai 2029 pour des services de calcul. L'accord soutient l'entraînement des IA sur les installations Colossus 1 et 2.

Loi sur l'IA de Schiff-Rounds dans l'éducation : Ce que les développeurs doivent savoir sur le projet de loi sur la culture numérique en IA pour la maternelle à la 12e année
OpenAI, Google et Microsoft soutiennent le LIFT AI Act, qui finance des subventions de la NSF pour des programmes d'éducation à l'IA de la maternelle à la terminale, la formation des enseignants et des outils d'évaluation.

Le code source de Claude aurait fuité, révélant des détails sur l'architecture de l'agent
Le code source de Claude Code, l'agent d'IA de codage d'Anthropic, semble avoir fuité, contenant l'intégralité du dépôt avec les invites système, l'implémentation de la boucle de l'agent et l'infrastructure d'appel d'outils.