클로드 코드 토큰 감사 결과, 기본 도구 로딩으로 인한 숨겨진 비용이 드러났습니다.

✍️ OpenClawRadar📅 게시일: April 15, 2026🔗 Source
클로드 코드 토큰 감사 결과, 기본 도구 로딩으로 인한 숨겨진 비용이 드러났습니다.
Ad

토큰 낭비 조사로 상당한 오버헤드 발견

한 개발자가 Anthropic의 속도 제한 변경 후 빠른 토큰 소비를 확인하고 926개의 Claude Code 세션을 감사했습니다. 조사 결과 모든 Claude Code 세션은 사용자 입력 전에 약 45,000개의 토큰 기본 페이로드로 시작하는 것으로 나타났습니다. 여기에는 시스템 프롬프트, 도구 정의, 에이전트 설명, 메모리 파일, 기술 설명 및 MCP 스키마가 포함됩니다.

표준 200k 컨텍스트 창에서 이 45,000개의 시작 로드는 대화 시작 전에 사용 가능한 컨텍스트의 20% 이상을 소비하는 것을 의미합니다. Claude Code가 상태 비저장 루프로 작동하기 때문에 이 전체 컨텍스트는 매 턴마다 재구성되어 재전송되므로 시작 오버헤드가 반복 비용이 됩니다.

기본 도구 로딩이 상당한 토큰 소비

감사 결과 시작 컨텍스트의 20,000개 토큰이 시스템 도구 스키마 정의에서 비롯된 것으로 나타났습니다. 기본적으로 Claude Code는 해당 도구 사용 여부와 관계없이 세션 시작 시 사용 가능한 모든 도구의 전체 JSON 스키마를 컨텍스트에 로드합니다.

개발자는 지연된 도구 로딩을 가능하게 하는 enable_tool_search라는 설정을 발견했습니다. 이 설정이 활성화되면 초기에 6개의 주요 도구만 로드하고 나머지는 필요 시 지연 로드하여 모든 도구 스키마를 한꺼번에 덤프하지 않습니다.

구성 변경으로 즉각적인 절감 효과

지연된 도구 로딩을 활성화하려면 settings.json에 다음을 추가하세요:

{
  "env": {
    "ENABLE_TOOL_SEARCH": "true"
  }
}

이 단일 구성 변경으로 시작 컨텍스트가 45,000개에서 20,000개 토큰으로 줄어들었으며, 시스템 도구 오버헤드는 20,000개에서 6,000개 토큰으로 감소했습니다. 이는 모든 세션의 매 턴마다 14,000개의 토큰을 절약합니다.

Ad

기본 설정의 비용 영향

개발자는 이 한 가지 설정이 자신의 사용량에 미치는 영향을 계산했습니다. 세션당 평균 22턴을 기준으로 턴당 14,000개의 추가 토큰은 세션당 308,000개의 불필요한 토큰으로 이어졌습니다. 858개 세션에 걸쳐 이는 총 2억 6,400만 개의 토큰이었습니다.

캐시 읽기 가격($0.50/MTok) 기준으로 이는 $132의 불필요한 비용을 나타냈습니다. 그러나 턴의 절반 이상이 만료된 캐시를 적중했기 때문에(전체 입력 가격인 $5/MTok가 트리거됨) 실제 비용은 이 단일 기본 설정으로 인해 $132에서 $1,300 사이로 추정되었습니다.

추가 최적화 전략

개발자는 시작 컨텍스트를 4,000-5,000개 토큰 줄이는 다른 최적화도 구현했습니다:

  • CLAUDE 마크다운 및 메모리 파일 다듬기 및 재작업
  • 기술 설명 통합
  • 사용하지 않는 MCP 서버 끄기
  • 메모리 훅의 스키마 주입 강화

Claude Code는 대화를 ~/.claude/projects/ 아래의 로컬 JSONL 파일로 저장하지만, 세션별 상세 분석, 프로젝트별 비용 또는 비용 범주를 얻을 수 있는 내장 방법은 없습니다. 내장 /insights 명령은 낭비 진단에 불충분한 것으로 판명되었습니다.

📖 전체 소스 읽기: r/ClaudeAI

Ad

👀 See Also

커뮤니티, OpenClaw 토큰 소비 해결책 논의
Tips

커뮤니티, OpenClaw 토큰 소비 해결책 논의

사용자들은 AI 에이전트를 24시간 가동할 때 발생하는 높은 토큰 사용량을 관리하는 전략을 공유합니다.

OpenClaw Radar
모든 프롬프트에 모든 MCP 서버를 로딩하면 조용히 토큰 예산이 소진된다
Tips

모든 프롬프트에 모든 MCP 서버를 로딩하면 조용히 토큰 예산이 소진된다

5~6개의 MCP 서버를 사용하는 한 사용자는 각 프롬프트가 모든 서버를 로드하여 막대한 토큰 낭비를 초래한다는 사실을 발견했습니다. 관련 서버만 로드하는 라우팅 레이어를 구현함으로써 토큰 사용량이 크게 줄고 응답 시간이 개선되었습니다.

OpenClawRadar
클로드 사용자가 직접적 기술 피드백을 위한 '내 감정 관리하지 마세요' 프롬프트 공유
Tips

클로드 사용자가 직접적 기술 피드백을 위한 '내 감정 관리하지 마세요' 프롬프트 공유

한 Claude 사용자는 검증 서문을 줄이고 더 직접적인 기술적 피드백을 받기 위해 사용자 환경설정에 특정 프롬프트를 설정할 것을 권장합니다. 이 프롬프트는 Claude에게 외교적 표현을 건너뛰고 기술 및 창작 작업에 대한 직설적인 비판을 제공하도록 지시합니다.

OpenClawRadar
라우팅으로 OpenClaw Max 사용 비용 85% 절감: API 라우팅으로 월 $200에서 $30으로
Tips

라우팅으로 OpenClaw Max 사용 비용 85% 절감: API 라우팅으로 월 $200에서 $30으로

한 사용자가 토큰 사용량을 추적한 결과, 작업의 15%만이 Opus를 필요로 한다는 것을 발견했습니다. API를 통해 일상적인 작업을 Sonnet으로 라우팅함으로써 월 비용이 $200에서 $30으로 줄었고, 출력 품질은 동일했습니다.

OpenClawRadar