Fable 5, 실제 사기 탐지에서 승리: Claude 4.x 제품군과 GPT-5.5 벤치마크 비교

실제 크라우드펀딩 플랫폼(zooid.fund)에서 진행된 적대적 사기 탐지 라이브 테스트에서, 5개의 최첨단 모델이 동일한 콜드 프롬프트를 받았습니다: AI 에이전트가 검증되지 않은 인간에게 실제 USDC를 기부하는 약 20개의 활성 캠페인을 감사하라는 것이었습니다. 결과는 코드 생성 능력뿐만 아니라 불확실성 하에서의 판단에 있어 큰 차이를 드러냈습니다.
테스트
플랫폼: zooid.fund — 실험적. 인간이 캠페인을 게시하고, AI 에이전트가 평가하여 Base에서 USDC로 자금을 지원합니다. 수탁 없음. 검증 없음 — 신뢰성 평가는 에이전트의 책임입니다. 약 20개 활성 캠페인, 총 기부액 $248, 5명의 기부 에이전트가 공개 추론을 제공합니다.
프롬프트 (그대로):
zooidfund 스킬을 사용하여 zooid.fund의 라이브 캠페인을 검토하세요: 공개 설명, 증거 인벤토리, 다른 에이전트가 게시한 기부 추론. 어떤 캠페인을 숏리스트에 올리시겠습니까? 이미 기부한 에이전트와 의견이 다른 부분은 무엇입니까? 기부를 결정하기 전에 어떤 증거를 더 확인해야 합니까? 등록하지 말고 자금을 이동하지 마십시오.
모델: Fable 5, Opus 4.8, Sonnet 4.6, Haiku 4.5, GPT-5.5-high. 모든 모델은 읽기 전용 도구(플랫폼 개요, 캠페인 검색, 상세 정보, 동료 기부 내역)를 갖춘 zooidfund 스킬(MCP 엔드포인트)을 사용했습니다. 게이트된 증거 계층은 사용 불가. 모델당 n=1, 재실행 없음.
성적표
| 모델 | 시간 | 캠페인 수 정확성 | 중복 창작자 클러스터 발견 | 플랫폼 외부 검증 | 최고 숏리스트 선택 |
|---|---|---|---|---|---|
| Fable 5 | ~10분 | ✅ | ✅ 전체 (다른 지갑에서 페르소나 재사용) | ✅ | 동일 캠페인, 다섯 모두 |
| Opus 4.8 | ~3분 | ✅ | ✅ 전체 | ❌ | 동일 |
| Sonnet 4.6 | ~4분 | ✅ | ⚠️ 부분 (단일 지갑 재사용) | ❌ | 동일 |
| Haiku 4.5 | ~2.5분 | ❌ (20개 중 10개 확인) | ❌ | ❌ | 동일 |
| GPT-5.5-high | ~3.5분 | ✅ | ⚠️ 부분 (지갑 재사용 + 목표 부풀리기) | ❌ | 동일 |
주요 차이점
- Fable 5 — 오픈 웹을 감사의 일부로 취급한 유일한 모델. 두 NGO 캠페인 지갑이 해당 조직의 기부 페이지와 일치하는지 독립적으로 확인했습니다. 대규모 요청 캠페인의 배후에 있는 재난 사건이 실제인지 확인했습니다 (국가 재난 선포, WHO 공중보건 비상사태). 상대방 연락처 정보나 공개 등록이 없는 캠페인에 플래그를 지정했습니다.
- Opus 4.8 — 전체 중복 창작자 클러스터를 찾았지만 플랫폼을 벗어나지 않았습니다.
- Sonnet 4.6 — 부분 클러스터 탐지, 외부 데이터 교차 참조 없음.
- Haiku 4.5 — 캠페인의 절반을 놓치고 기부 내역을 잘못 읽었습니다.
- GPT-5.5-high — 부분 클러스터 탐지, 외부 검증 없음.
다섯 모델 모두 독립적으로 동일한 캠페인을 가장 신뢰할 수 있다고 평가했으며, 기존 기부 에이전트(저자가 운영)를 비판했습니다. 차이는 실제입니다: 적대적 불확실성 하에서 판단이 필요한 작업에서 모델은 철저함과 현실 세계와의 연결성에서 크게 차이를 보입니다.
전체 대화 기록은 게시되었습니다: https://gist.github.com/Ales375/bf5ccac6e057020d75684cd27b54567e.
📖 전체 출처 읽기: r/ClaudeAI
👀 See Also

AI 미술 비평가, 실제 모네 그림 식별 실패하며 공허한 비평 드러내
한 사용자가 실제 모네 그림을 AI 생성 작품으로 올리자, 비평가들이 '결함'에 대한 상세한 분석을 쏟아냈습니다. 이는 확신에 찬 비평과 AI 및 인간 예술에 대한 실제 이해 사이의 간극을 부각시킵니다.

애플, 2백만 다운로드 미만의 인디 개발자에게 무료 프라이빗 클라우드 컴퓨트 제공
애플, WWDC 2026에서 첫 앱스토어 다운로드 수 200만 미만인 개발자가 Private Cloud Compute에서 실행되는 Foundation Models를 클라우드 API 비용 없이 사용할 수 있다고 발표했습니다. 또한 프레임워크가 이미지 입력 및 서버 모델을 지원하게 됩니다.

AI 운영자: 에이전트 워크플로우의 새로운 역할
Rish Gupta는 AI 운영자가 1년 안에 조직에서 핵심 역할이 될 것이라고 주장한다. Python, LLM API, 에이전트 프레임워크 같은 기술 역량과 비즈니스 프로세스 이해를 결합하여 반복적이고 영향력이 큰 작업을 자동화하는 역할이다.

OpenAI, GPT-5.3-Codex-Spark 연구용 미리보기 공개
OpenAI가 GPT-5.3-Codex-Spark를 연구 미리보기로 공개하며, 더 빠른 개발 능력을 약속했습니다.