/loop 명령어로 하룻밤 사이에 Claude API 6,000달러가 소진된 방법

Reddit 사용자가 자신의 Claude 사용 한도가 소진된 사실을 깨었는데, 원인은 claude-opus-4-7에서 /loop 30m check my PRs 명령어 하나가 26시간 동안 46번 실행되며 약 6,000달러를 소모한 것입니다. 근본 원인은 프롬프트 캐싱 동작과 장기 세션의 결합이었습니다.
기술적 분석은 다음과 같습니다:
- 컨텍스트 창이 반복마다 증가: 각 API 호출은 전체 대화 기록을 전송합니다. 첫 번째 턴은 수백 개의 토큰일 수 있지만, 46번째 턴은 80만 개의 토큰을 전송합니다. 각 턴에 전송된 모든 데이터에 대해 비용을 지불합니다.
- 프롬프트 캐싱은 약 5분 후 만료: Anthropic은 대화 기록을 캐시 윈도우 내에서 재사용할 경우 12.5배 할인된 가격으로 캐싱합니다. 그러나
/loop 30m의 경우 30분 간격이 5분 캐시 TTL을 초과합니다. 각 반복마다 전체 증가하는 컨텍스트를 처음부터 다시 캐싱하는 비싼 쓰기 비용을 지불합니다. - 출력이 컨텍스트에 추가: 각 루프 반복은 자신의 출력을 대화에 추가하여 다음 재캐싱을 더욱 크게 만듭니다. 20시간째에 세션은 약 80만 개의 토큰에 도달했습니다.
- 대시보드 지연이 피해를 숨김: Anthropic 사용 대시보드는 며칠 지연된 보고를 제공합니다. 유일한 실시간 신호는 한도 초과 알림 이메일이었지만, 그때는 이미 돈이 지출된 후였습니다.
이를 피하기 위한 사용자의 주요 권장 사항:
- 중단 조건 추가: 단순한
/loop 30m check my PRs대신/loop 30m check my PRs — stop when all are merged or after 3 hours로 작성하세요. 조건이 충족되면 Claude가 루프를 종료합니다. - 무인 작업에는 Sonnet 사용: Opus는 출력 토큰당 약 5배 더 비쌉니다. PR 확인과 같은 폴링 작업에는 Sonnet으로 충분합니다. Opus는 사용자가 참여하는 세션에 아껴두세요.
- 대시보드를 신뢰하지 마세요: 며칠 지연됩니다. 실시간 청구 신호로는 사용 한도 이메일에 의존하세요.
- 새로운 세션이 더 저렴: 장기 세션은 5분 이상 간격의 모든 호출이 전체 컨텍스트를 재캐싱하는 비용을 부담하므로 비용이 누적됩니다. 새 세션을 시작하면 컨텍스트가 초기화되어 이를 피할 수 있습니다.
max_turns는 루프 제한 장치가 아님: 단일 반복 내에서 도구 호출 체인을 제한할 뿐, 루프가 실행되는 횟수를 제한하지 않습니다./loop의 유일한 내장 만료는 7일 후 자동 삭제입니다.
루프는 메인 대화에서 실행되므로, 동일한 세션을 유지하면 각 루프 실행이 필요 이상으로 많은 토큰을 읽고 쓰게 되어 비용이 기하급수적으로 증가합니다.
Claude를 /loop으로 자동화할 때는 항상 중단 조건을 설정하고, 더 저렴한 모델을 사용하며, 외부 도구로 모니터링하세요. 캐시 할인은 호출이 TTL 내에 있을 만큼 자주 발생할 때만 도움이 됩니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

1일차 설정: 일반적인 OpenClaw 문제의 90%를 예방하는 방법
지출 한도를 설정하고, SOUL.md를 작성하며, 하트비트 간격을 조정하여 예상치 못한 청구, 문제 행동, 비용 충격을 방지하세요.

OpenClaw에서 높은 CPU/RAM 및 게이트웨이 재시작 문제? 텔레그램에서 IPv6 비활성화
텔레그램 봇 설정에서 autoSelectFamily: false 및 dnsResultOrder: 'ipv4first'를 설정하면 ENETUNREACH 오류를 해결하여 높은 CPU 사용, 이벤트 루프 중단, 게이트웨이 재시작 문제를 해결할 수 있습니다.

OpenClaw WhatsApp 자동 응답 기능이 2026.4.2 버전에서 미디어 이해 기능을 건너뛸 수 있습니다.
사용자가 OpenClaw 2026.4.2의 WhatsApp 자동 응답 흐름이 미디어 이해 파이프라인을 건너뛸 수 있어, Groq와 같은 외부 STT 백엔드를 사용할 때 음성 메모의 전사가 방지된다고 보고합니다. 수정 방법은 에이전트 디스패치 전에 미디어 이해를 명시적으로 호출하는 것입니다.

텔레그램 vs 디스코드 vs 왓츠앱: 당신의 OpenClaw 채널 선택하기
없음