AI 인터뷰 플랫폼 테스트: 채용 심사에서의 CodeSignal, Humanly, Eightfold

더 버지(The Verge)의 선임 AI 기자 헤이든 필드(Hayden Field)는 채용 심사를 위한 세 가지 AI 인터뷰 플랫폼을 테스트했습니다: CodeSignal, Humanly, Eightfold. 이 플랫폼들은 AI 아바타를 사용하여 구직자와 일대일 화상 인터뷰를 진행하며 질문을 하고 응답을 분석합니다.
AI 인터뷰 플랫폼의 작동 방식
AI 도구들은 지원자가 화상 통화에 참여하여 AI 아바타가 질문을 하고 응답을 평가하는 방식으로 작동합니다. 이러한 플랫폼을 개발한 회사들은 기업이 초기 심사를 위해 일부 지원자만이 아니라 거의 모든 지원자를 가상으로 인터뷰할 수 있게 해준다고 주장합니다. 일부에서는 이러한 시스템이 시각적 단서보다는 응답을 분석함으로써 편향을 줄일 수 있다고 주장합니다.
한계와 과제
편향 감소 주장에도 불구하고, 기사는 편향 없는 AI 시스템을 달성하는 것은 불가능하다고 지적합니다. 모델들은 성차별, 인종차별 및 기타 편향을 포함한 대규모 인터넷 데이터셋으로 훈련됩니다. 필드는 일부 플랫폼이 다른 것보다 더 자연스럽게 느껴졌지만, 매번 자신이 사람과 대화하고 있기를 바랐다고 보고했습니다. 그녀는 특히 자신의 답변을 듣는 AI 아바타를 바라보며 '불쾌한 골짜기(uncanny valley)' 효과로 어려움을 겪었다고 언급했습니다.
테스트 방법론
필드는 그녀의 현재 역할을 기반으로 한 연습용으로 생성된 포지션과 Vox Media에 게시된 실제 채용 공고를 포함한 다양한 직무에 대해 플랫폼들을 테스트했습니다. 테스트 결과 각 플랫폼이 얼마나 자연스럽게 느껴지는지에 차이가 있었지만, 모두 인간이 진행하는 인터뷰가 아닌 AI 주도라는 근본적인 한계를 공유하고 있었습니다.
📖 Read the full source: HN AI Agents
👀 See Also

클로드는 2주 동안 피크 시간 외 사용 제한을 두 배로 늘립니다.
Anthropic은 모든 요금제에 대해 피크 시간 외에 Claude 사용 한도를 일시적으로 두 배로 늘립니다. 평일에는 태평양 표준시 오전 5시~11시/그리니치 표준시 오후 12시~6시를 제외하고 2배 사용량이 적용되며, 주말에는 하루 종일 2배 사용량이 제공됩니다.

Claude Desktop 1.1.4498 릴리스 노트: 독 바운스, 셸 환경 확장 및 정부 클라우드 지원
Claude Desktop 1.1.4498는 사용자 주의를 위한 독 바운스 알림을 추가하고, 셸 환경 추출을 Claude 관련 변수까지 확대하며, 정부/사용자 정의 배포 감지 기능을 도입합니다. 이 업데이트는 또한 Chrome 브리지 도구 호출 타임아웃을 120초에서 10초로 단축합니다.
Opus 4.7, 약 500개의 지시사항을 따를 수 있어, 1년 전 약 150개에서 증가
2026년 5월 업데이트된 연구에 따르면, Opus 4.7은 약 500개의 지시를 안정적으로 따를 수 있는 반면, 2025년 7월에는 약 150개였습니다. GPT-5.5는 약 5000개를 처리합니다. 이는 CLAUDE.md 파일 크기에 시사하는 바가 있습니다.

Agora-1: 실시간 공유 시뮬레이션을 위한 오픈 소스 다중 에이전트 세계 모델
Odyssey가 Agora-1을 출시했습니다. 이는 최대 4명의 에이전트(인간 또는 AI)가 GoldenEye를 테스트 환경으로 사용하여 실시간으로 생성된 시뮬레이션을 공유할 수 있는 세계 모델입니다.