Claude API /loop 명령어로 6,000달러 과금 사례와 방지법

Reddit 사용자가 자신의 Claude 사용 한도가 소진된 사실을 깨었는데, 원인은 claude-opus-4-7에서 /loop 30m check my PRs 명령어 하나가 26시간 동안 46번 실행되며 약 6,000달러를 소모한 것입니다. 근본 원인은 프롬프트 캐싱 동작과 장기 세션의 결합이었습니다.

기술적 분석은 다음과 같습니다:

컨텍스트 창이 반복마다 증가: 각 API 호출은 전체 대화 기록을 전송합니다. 첫 번째 턴은 수백 개의 토큰일 수 있지만, 46번째 턴은 80만 개의 토큰을 전송합니다. 각 턴에 전송된 모든 데이터에 대해 비용을 지불합니다.
프롬프트 캐싱은 약 5분 후 만료: Anthropic은 대화 기록을 캐시 윈도우 내에서 재사용할 경우 12.5배 할인된 가격으로 캐싱합니다. 그러나 /loop 30m의 경우 30분 간격이 5분 캐시 TTL을 초과합니다. 각 반복마다 전체 증가하는 컨텍스트를 처음부터 다시 캐싱하는 비싼 쓰기 비용을 지불합니다.
출력이 컨텍스트에 추가: 각 루프 반복은 자신의 출력을 대화에 추가하여 다음 재캐싱을 더욱 크게 만듭니다. 20시간째에 세션은 약 80만 개의 토큰에 도달했습니다.
대시보드 지연이 피해를 숨김: Anthropic 사용 대시보드는 며칠 지연된 보고를 제공합니다. 유일한 실시간 신호는 한도 초과 알림 이메일이었지만, 그때는 이미 돈이 지출된 후였습니다.

이를 피하기 위한 사용자의 주요 권장 사항:

중단 조건 추가: 단순한 /loop 30m check my PRs 대신 /loop 30m check my PRs — stop when all are merged or after 3 hours로 작성하세요. 조건이 충족되면 Claude가 루프를 종료합니다.
무인 작업에는 Sonnet 사용: Opus는 출력 토큰당 약 5배 더 비쌉니다. PR 확인과 같은 폴링 작업에는 Sonnet으로 충분합니다. Opus는 사용자가 참여하는 세션에 아껴두세요.
대시보드를 신뢰하지 마세요: 며칠 지연됩니다. 실시간 청구 신호로는 사용 한도 이메일에 의존하세요.
새로운 세션이 더 저렴: 장기 세션은 5분 이상 간격의 모든 호출이 전체 컨텍스트를 재캐싱하는 비용을 부담하므로 비용이 누적됩니다. 새 세션을 시작하면 컨텍스트가 초기화되어 이를 피할 수 있습니다.
max_turns는 루프 제한 장치가 아님: 단일 반복 내에서 도구 호출 체인을 제한할 뿐, 루프가 실행되는 횟수를 제한하지 않습니다. /loop의 유일한 내장 만료는 7일 후 자동 삭제입니다.

루프는 메인 대화에서 실행되므로, 동일한 세션을 유지하면 각 루프 실행이 필요 이상으로 많은 토큰을 읽고 쓰게 되어 비용이 기하급수적으로 증가합니다.

Claude를 /loop으로 자동화할 때는 항상 중단 조건을 설정하고, 더 저렴한 모델을 사용하며, 외부 도구로 모니터링하세요. 캐시 할인은 호출이 TTL 내에 있을 만큼 자주 발생할 때만 도움이 됩니다.

📖 Read the full source: r/ClaudeAI

/loop 명령어로 하룻밤 사이에 Claude API 6,000달러가 소진된 방법

👀 See Also

효율적인 AI 코딩 에이전트를 위한 SOUL.md 파일 작성법

MTP 수용률: 50% 임계값이 투기적 디코딩 이점을 결정한다

tmux와 at을 사용한 Claude 세션 재시작 자동화

클로드 코드 컨텍스트 창의 비용과 성능 관리