Claude Code 1억 토큰 분석 결과 입력 사용률 99.4%

추적된 100M 토큰의 사용량 분석

Claude Code 사용에 대한 상세 분석은 확장된 코딩 세션에서 1,289개 요청을 추적하여 총 약 100.9M 토큰을 기록했습니다. 이 분석은 입력과 출력 토큰 간에 상당한 불균형이 있음을 보여줍니다.

토큰 분포:

입력 토큰: 100.3M (전체의 99.4%)
캐시된 토큰: 84.2M (입력의 84%)
출력 토큰: 616K (전체의 0.6%)

컨텍스트 재읽기 병목 현상

Claude Code는 토큰 예산의 99.4%를 컨텍스트 읽기에 사용하고 코드 작성에는 단 0.6%만 사용합니다. 이 패턴은 Claude Code에만 국한된 것이 아니라 모든 에이전트형 코딩 시스템이 현재 작동하는 방식을 반영합니다. Claude Code가 파일 읽기, 명령 실행, 코드 편집과 같은 동작을 할 때마다 저장소 구조, 대화 기록, 도구 결과, 오류 로그를 포함한 전체 컨텍스트를 다시 입력해야 합니다.

84M 캐시된 토큰은 모델이 턴 사이에 지속적인 메모리를 갖지 못해 동일한 컨텍스트가 1,289번 재전송된 것을 나타냅니다. 코드베이스의 정신적 모델을 유지하는 인간 개발자와 달리, Claude Code는 다음과 같은 패턴을 따릅니다: 모든 것을 잊기 → 모든 것을 다시 읽기 → 코드 작성 → 다시 모든 것을 잊기.

프롬프트 캐싱의 한계

Anthropic의 프롬프트 캐싱은 이 과정을 더 저렴하게 만들지만 더 빠르게 만들지는 않습니다. 병목 현상은 추론 속도가 아니라 재읽기 루프에 있습니다. 이 분석은 Claude Code와 일반적인 에이전트형 코딩을 위한 진정한 해결책이 지속적인 프로젝트 메모리일 것임을 시사합니다. 이는 단순히 메모리 파일이나 CLAUDE.md를 통한 사실 저장이 아니라, 세션 간에 이어지는 코드베이스에 대한 압축되고 진화하는 이해를 의미합니다.

현재 시스템은 이해를 구축하기보다는 반복된 컨텍스트를 통해 지능을 무력으로 구현합니다. 이 변화가 일어나는 날이 오면 동일한 정보를 반복적으로 처리할 필요가 없어져 AI 코딩이 진정으로 빨라질 수 있습니다.

📖 전체 소스 읽기: r/ClaudeAI