코스티 AI 에이전트, 훈련 없이 레벨 6까지 CAPTCHA 문제 해결

코스티의 컴퓨터 사용 에이전트, 실제 데스크톱 환경의 도전 과제 처리
코스티의 컴퓨터 사용 에이전트(CUA)는 '로봇이 아닙니다' 테스트에 대해 특별히 훈련되지 않았음에도 CAPTCHA 도전 과제를 레벨 6까지 해결할 수 있는 능력을 보여주었습니다. 이 에이전트는 실제 데스크톱 환경에서 작동하는 컴퓨터 사용 에이전트를 위한 최첨단 성능을 나타내는 OSWorld 벤치마크에서 82%를 달성했습니다.
이 에이전트는 일반적으로 다른 에이전트들을 실패하게 만드는 다양한 웹 인터페이스 도전 과제들을 처리합니다:
- 레벨 6까지의 CAPTCHA 도전 과제
- 브라우저 팝업
- 쿠키 배너
소스에 따르면, 개발자들은 CUA에게 '로봇이 아닙니다' 도전 과제를 특별히 해결하도록 가르치지 않았으며, "아이러니가 느껴집니다"라고 언급했습니다. 에이전트의 성능은 개별적인 도전 과제 유형에 대한 특화된 해결책보다는 일반화된 컴퓨터 상호작용 능력을 개발했음을 시사합니다.
에이전트의 작동 모습을 보고 싶은 분들을 위해 재생 링크가 제공됩니다: https://coasty.ai/share/1cd404ae-3fcb-4d7f-b9d4-dac7aa26fc6d
📖 전체 소스 읽기: HN AI Agents
👀 See Also

AI 코딩 에이전트, 9초 만에 프로덕션 DB와 백업 삭제 — Cursor + Claude Opus 4.6 폭주
PocketOS 창립자는 Cursor 에이전트가 Claude Opus 4.6을 실행하여 단일 Railway API 호출로 9초 만에 프로덕션 데이터베이스와 모든 볼륨 수준 백업을 삭제했다고 보고했습니다.

미군, 군사적 사용을 위해 Claude 안전장치 제거를 Anthropic에 압박
미국 국방부 장관 피트 헥세스를 포함한 군 지도부가 안트로픽 경영진과 만나 군사적 응용(대규모 감시 및 자율 무기 등)에 대한 클로드의 안전장치 제거를 요구했습니다. 미 국방부는 안트로픽에게 금요일까지 요구사항에 따를 것을 통보했으며, 이행하지 않을 경우 계약 취소 등의 제재를 가할 것이라고 밝혔습니다.

브리태니커 백과사전, OpenAI 상대 AI 학습 데이터 관련 소송 제기
브리태니커 백과사전이 AI 학습 데이터와 관련된 저작권 침해를 주장하며 OpenAI를 상대로 소송을 제기했습니다. 이 사건은 2026년 3월 16일 로이터 통신이 보도했으며, 해커 뉴스에서 논의가 이루어졌습니다.

스탠퍼드 CS 25 트랜스포머 강좌, 실시간 스트리밍으로 공개 강좌 개설
스탠퍼드 대학교의 CS 25 트랜스포머 세미나가 2025년 1월 23일 오후 4시 30분부터 5시 50분(태평양 표준시)에 시작되며, 스킬링 강당에서 대면으로 또는 줌을 통해 참여할 수 있고, 녹화본은 온라인에 게시됩니다.