Claude Fable 데모: 브라우저 자동화를 통한 지속적인 버그 수정

Simon Willison의 Claude Fable은 끊임없이 능동적이다 포스트는 Claude Fable 5가 Datasette Agent의 가로 스크롤바 버그를 자동으로 진단한 방법을 보여줍니다. 의존성을 확인하라고 지시한 후, Fable은 예상치 못한 작업을 수행했습니다 — 브라우저 창을 열고, JavaScript를 삽입하고, 사용자 정의 CORS 웹 서버를 작성하는 등 명시적인 지시 없이 모두 수행했습니다.
관찰된 주요 동작
- 브라우저 창 감지: Fable은
uv run --with pyobjc-framework-Quartz를 사용하여 macOS 창을 열거하고, 예상 문자열(예:textarea)이 포함된 Safari 창을 필터링했습니다. 그런 다음screencapture -x -o -l [window_id]를 사용하여 스크린샷을 캡처했습니다. - 템플릿 삽입: 모달 대화상자를 트리거하기 위해(보통 키보드 단축키 필요), Fable은 Datasette의 템플릿을 편집하여
<script>window.addEventListener('load', function() { setTimeout(function() { document.dispatchEvent(new KeyboardEvent('keydown', {key: '/', bubbles:true})); },1200); });</script>를 삽입했습니다. 이는 페이지 로드 후 1.2초 후에/키를 시뮬레이션했습니다. - 사용자 정의 CORS 웹 서버: Fable은
http.server(표준 라이브러리)를 사용하여127.0.0.1:9999에서 실행되는 Python HTTP 서버를 작성했습니다. JSON으로 POST 요청을 수락하고/tmp/diag.json에 쓰며,Access-Control-Allow-Origin: *헤더를 설정하여 테스트 페이지의 JavaScript가 진단 데이터를 다시 보낼 수 있도록 했습니다.
작동 방식
Fable은 스크롤바 버그가 의존성(Datasette 자체)에 있을 가능성을 식별했습니다. 로컬 템플릿을 편집하여 대화상자를 자동 트리거하고, 새로 생성된 테스트 HTML 페이지로 Safari를 열고, screencapture를 통해 스크린샷을 찍고, 브라우저에서 JavaScript를 실행하여 측정값을 자체 로컬 웹 서버로 보냈습니다. 이 모든 과정이 자동으로 이루어졌습니다 — Willison은 초기 프롬프트와 스크린샷만 제공했습니다.
이는 Fable의 끊임없는 능동성을 보여줍니다: 우회 방법을 고안하고, 브라우저를 계측하며, 지시 없이도 다단계 디버깅 파이프라인을 조율합니다.
📖 전체 출처 읽기: HN AI Agents
👀 See Also

인터페이즈: 결정론적 작업에서 제미니-3-플래시와 GPT-5.4-미니를 능가하는 새로운 모델 아키텍처
DNN/CNN과 트랜스포머를 결합한 새로운 모델 아키텍처 Interfaze가 OCR, 비전, STT, 구조화된 출력 등 9개 벤치마크에서 Gemini-3-Flash, Claude-Sonnet-4.6, GPT-5.4-Mini, Grok-4.3을 능가합니다.

LLM 숨겨진 에이전시 신호(Â)를 활용한 향상된 도구 호출
개발자가 LLM이 AUC > 0.94로 도구 호출을 예측하는 선형 분리 가능한 숨겨진 상태 방향인 Â를 가지고 있음을 발견했습니다. 이 신호를 사용하여 도구 호출을 강제하면 Qwen3-1.7B 성능이 26.7%에서 85%로 향상되었으며(+58% 이득), 도구 미사용 실패가 43%에서 2.6%로 감소했습니다.

MCP 서버, Claude Code에 검색 점수화 기능을 탑재한 영구 메모리 추가
한 개발자가 engram-mcp라는 MCP 서버를 구축하여 Claude Code에 세션과 프로젝트를 넘나드는 지속적인 메모리를 부여했습니다. 이 시스템은 결과 성공 여부에 따른 자동 검색 점수화와 오래된 지식에 대한 드리프트 감지를 특징으로 합니다.

x402와 솔라나를 활용한 AI 에이전트 마이크로결제 데모
x402-hello 데모는 솔라나 블록체인에서 USDC를 사용하여 AI 에이전트가 자율적으로 마이크로결제를 처리하는 방법을 보여줍니다.