코스티 CUA, OSWorld 82% 달성…CAPTCHA 레벨 6 해결

코스티의 컴퓨터 사용 에이전트, 실제 데스크톱 환경의 도전 과제 처리

코스티의 컴퓨터 사용 에이전트(CUA)는 '로봇이 아닙니다' 테스트에 대해 특별히 훈련되지 않았음에도 CAPTCHA 도전 과제를 레벨 6까지 해결할 수 있는 능력을 보여주었습니다. 이 에이전트는 실제 데스크톱 환경에서 작동하는 컴퓨터 사용 에이전트를 위한 최첨단 성능을 나타내는 OSWorld 벤치마크에서 82%를 달성했습니다.

이 에이전트는 일반적으로 다른 에이전트들을 실패하게 만드는 다양한 웹 인터페이스 도전 과제들을 처리합니다:

레벨 6까지의 CAPTCHA 도전 과제
브라우저 팝업
쿠키 배너

소스에 따르면, 개발자들은 CUA에게 '로봇이 아닙니다' 도전 과제를 특별히 해결하도록 가르치지 않았으며, "아이러니가 느껴집니다"라고 언급했습니다. 에이전트의 성능은 개별적인 도전 과제 유형에 대한 특화된 해결책보다는 일반화된 컴퓨터 상호작용 능력을 개발했음을 시사합니다.

에이전트의 작동 모습을 보고 싶은 분들을 위해 재생 링크가 제공됩니다: https://coasty.ai/share/1cd404ae-3fcb-4d7f-b9d4-dac7aa26fc6d

📖 전체 소스 읽기: HN AI Agents

코스티 AI 에이전트, 훈련 없이 레벨 6까지 CAPTCHA 문제 해결

코스티의 컴퓨터 사용 에이전트, 실제 데스크톱 환경의 도전 과제 처리

👀 See Also

API 요구 사항에 맞는 최적의 토큰 제공자 선택하기

개발자의 옵시디언 AI 에이전트 프로젝트, 하룻밤 사이 화제 되다

레딧 토론에서 챗봇에서 로컬 실행이 가능한 자율 에이전트로의 전환을 강조합니다

딥시크, 알리바바 제안 거절: 500억 달러 펀딩 라운드, 빅테크 통합보다 독립성 우선시