코드를 작성하기 전에 AI 환각 현상을 포착하기 위해 /probe 사용하기

/probe가 하는 일
/probe 기법은 AI가 생성한 계획이 각 주장된 사실을 예상값과 함께 번호가 매겨진 CLAIM으로 출력하도록 강제합니다. 그런 다음 실제 시스템을 조사하는 명령을 실행하여 예상 결과와 실제 결과 사이의 차이를 포착합니다.
출처의 실제 예시
한 개발자가 ~/.claude/projects/... 아래에 저장된 Claude의 JSONL 세션 파일을 파싱하려 했습니다. Claude는 형식을 자신 있게 설명했지만, /probe를 실행하면 네 가지 환각이 드러났습니다:
- 주장 1: AI는 최상위 유형이 2가지(user, assistant)라고 말했습니다. 실제: queue-operation, file-history-snapshot, attachment, system, permission-mode, summary를 포함해 7가지 유형이 있습니다.
- 주장 2: AI는 assistant 내용 = text + tool_use라고 말했습니다. 실제: 확장 사고 모드에서 assistant 출력의 약 1/3을 차지하는 thinking 블록을 놓쳤습니다.
- 주장 3: AI는 user 내용이 항상 배열이라고 말했습니다. 실제: 다형성: 문자열 또는 배열입니다.
- 주장 4: AI는 폴더 이름에서 /를 -로 대체한다고 말했습니다. 실제: 실제로는 대시를 앞에 붙인 후 대체합니다.
/probe가 없었다면, jq 필터는 문자열 형태의 user 내용에서 오류를 일으키고, thinking 블록을 쓰레기로 덤프하며, 7가지 메시지 유형 중 5가지를 완전히 놓쳤을 것입니다.
프로브 작동 방식
AI는 jq -r '.type' file.jsonl | sort -u와 같은 명령을 실행하기 전에 "EXPECTED: 2 types"와 같은 주장을 작성합니다. 한 프로브 출력은 다음과 같았습니다:
CLAIM 1: JSONL has 2 top-level types (user, assistant) EXPECTED: 2 COMMAND: jq -r '.type' *.jsonl | sort -u | wc -l ACTUAL: 7 DELTA: +5 unknown types (queue-operation, file-history-snapshot, attachment, system, permission-mode, summary)
출처의 주요 통찰
프로브할 가치가 있는 주장은 종종 AI가 가장 자신 있어하는 것들입니다. AI가 주저할 때는 이미 확인해야 한다는 것을 알고 있습니다. AI가 단호하게 X라고 말할 때는 모릅니다. 높은 확신을 가진 주장이 환각이 숨어 있는 곳입니다.
또 다른 이점은 하나의 프로브가 N개의 영구적인 테스트가 된다는 것입니다. 7가지 유형 발견은 새로운 유형이 나타나면 CI가 실패하는 스키마 테스트가 됩니다. 문자열-또는-배열 발견은 두 형태를 퍼즈하는 속성 테스트가 됩니다. 업스트림 형식이 변경되면 테스트가 실패하고, 다시 프로브를 실행하며, 오라클이 업데이트됩니다.
제한 사항 및 개선점
프로브는 AI가 주장할 것이라고 생각하는 주장만 포착합니다. 알려지지 않은 미지의 것은 보이지 않습니다. 도움이 되는 것들:
- 주장을 생성하기 전에 현실을 열거하기 위해 먼저
jq 'keys'실행 - Dex Horthy의 CRISPY 패턴은 AI가 자신의 격차 목록을 표면화하도록 밀어붙입니다
- GitHub의 Spec Kit은 사양에서 [NEEDS CLARIFICATION] 마커를 사용하여 AI가 맹점을 표시하도록 강제합니다
- 주장 목록의 인간 검토도 권장됩니다
전통적인 TDD와의 대조
전통적인 TDD는 당신이 일어날 것이라고 생각하는 것에 기반하여 테스트를 작성합니다. 프로브 기반 TDD는 당신이 스파이크하거나 검증한 일어나는 것에 기반하여 테스트를 작성합니다. 목은 시스템에 대한 당신의 모델을 테스트합니다. 프로브는 시스템 자체를 테스트합니다.
소스 파일
개발자는 두 파일이 포함된 gist에 전체 /probe 스킬 파일을 공유했습니다:
- README.md: REPL-as-oracle 각도와 TDD 대조를 포함한 긴 글
- probe-skill.md: Claude Code 스킬로 로드되는 7단계 프로토콜
패턴은 단순히 "주장 테이블 + 실제 시스템 프로브 + 차이 포착"이며, 당신이 코딩하려는 시스템을 쿼리할 수 있는 모든 REPL 또는 CLI 도구와 함께 작동합니다.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

OpenClaw 인도 주식 시장 통합: 다중 에이전트 분석 및 트레이딩 터미널
인도 시장을 위한 오픈 소스 트레이딩 터미널이 OpenClaw 스킬 서버로 구성되어, 모든 OpenClaw 에이전트가 로컬 설치 없이 HTTP를 통해 인도 주식 시장 데이터를 가져오고 완전한 분석을 실행할 수 있게 되었습니다. 이 시스템은 7개의 전문 에이전트가 병렬로 작동하여 구조화된 분석과 거래 계획을 생성합니다.

Eä: 러스트로 작성된 파이썬용 SIMD 컴파일러
한 개발자가 약 12,000줄의 Rust로 SIMD 커널용 컴파일러인 Eä를 구축했습니다. 이 컴파일러는 .ea 파일에서 공유 라이브러리와 Python 래퍼를 생성하며, ctypes나 빌드 시스템 없이 NumPy 대비 6.6배의 속도 향상을 달성했습니다.

/compress-architecture: 과도한 엔지니어링을 제거하는 에이전트 기술
/compress-architecture라는 새로운 에이전트 스킬은 코드베이스에서 추측성 레이어, 단순 전달 모듈, 중복 개념을 감사하면서 실제 도메인 경계와 공개 API를 보호합니다.

에이전트메일 창립자, 오픈클로의 CAPTCHA 차단 폭로 후 에이전트 네이티브 온보딩 세부 사항 공개
AI 에이전트용 이메일 API인 AgentMail은 자사의 OpenClaw 에이전트가 Cloudflare CAPTCHA를 통과하지 못한 후 온보딩 플로우를 재구축했습니다. 새로운 시스템은 검증을 위해 인간을 포함한 상태에서 프로그램 방식의 계정 생성을 위한 단일 REST 엔드포인트를 제공합니다.