Claude Code에서 1억 개의 토큰을 분석한 결과 99.4%의 입력 사용률이 나타났습니다.

추적된 100M 토큰의 사용량 분석
Claude Code 사용에 대한 상세 분석은 확장된 코딩 세션에서 1,289개 요청을 추적하여 총 약 100.9M 토큰을 기록했습니다. 이 분석은 입력과 출력 토큰 간에 상당한 불균형이 있음을 보여줍니다.
토큰 분포:
- 입력 토큰: 100.3M (전체의 99.4%)
- 캐시된 토큰: 84.2M (입력의 84%)
- 출력 토큰: 616K (전체의 0.6%)
컨텍스트 재읽기 병목 현상
Claude Code는 토큰 예산의 99.4%를 컨텍스트 읽기에 사용하고 코드 작성에는 단 0.6%만 사용합니다. 이 패턴은 Claude Code에만 국한된 것이 아니라 모든 에이전트형 코딩 시스템이 현재 작동하는 방식을 반영합니다. Claude Code가 파일 읽기, 명령 실행, 코드 편집과 같은 동작을 할 때마다 저장소 구조, 대화 기록, 도구 결과, 오류 로그를 포함한 전체 컨텍스트를 다시 입력해야 합니다.
84M 캐시된 토큰은 모델이 턴 사이에 지속적인 메모리를 갖지 못해 동일한 컨텍스트가 1,289번 재전송된 것을 나타냅니다. 코드베이스의 정신적 모델을 유지하는 인간 개발자와 달리, Claude Code는 다음과 같은 패턴을 따릅니다: 모든 것을 잊기 → 모든 것을 다시 읽기 → 코드 작성 → 다시 모든 것을 잊기.
프롬프트 캐싱의 한계
Anthropic의 프롬프트 캐싱은 이 과정을 더 저렴하게 만들지만 더 빠르게 만들지는 않습니다. 병목 현상은 추론 속도가 아니라 재읽기 루프에 있습니다. 이 분석은 Claude Code와 일반적인 에이전트형 코딩을 위한 진정한 해결책이 지속적인 프로젝트 메모리일 것임을 시사합니다. 이는 단순히 메모리 파일이나 CLAUDE.md를 통한 사실 저장이 아니라, 세션 간에 이어지는 코드베이스에 대한 압축되고 진화하는 이해를 의미합니다.
현재 시스템은 이해를 구축하기보다는 반복된 컨텍스트를 통해 지능을 무력으로 구현합니다. 이 변화가 일어나는 날이 오면 동일한 정보를 반복적으로 처리할 필요가 없어져 AI 코딩이 진정으로 빨라질 수 있습니다.
📖 전체 소스 읽기: r/ClaudeAI
👀 See Also

클로드 MAX 플랜에 추가 비용 없이 100만 토큰 컨텍스트 윈도우가 포함됩니다
Claude MAX 플랜이 추가 API 사용 요금 없이 100만 토큰 컨텍스트 윈도우를 포함하도록 자동 업그레이드되었으며, 사용자들은 토큰 사용량이 크게 감소하고 컨텍스트 윈도우 관리 부담이 사라졌다고 보고합니다.

SenseNova-U1-8B-MoT: NEO-Unify 아키텍처를 갖춘 오픈 소스 네이티브 멀티모달 모델
센스노바가 센스노바-U1-8B-MoT를 출시했습니다. 이 모델은 시각 인코더와 VAE를 모두 제거하고 NEO-Unify 아키텍처를 사용하여 통합된 이해, 추론 및 생성을 가능하게 하는 네이티브 멀티모달 모델입니다. 텍스트-인포그래픽, 이미지 편집 및 인터리브 텍스트-이미지 생성에 탁월합니다.

Claude-Code v2.1.31 릴리스: 주요 업데이트 및 버그 수정
Claude-Code v2.1.31이 세션 재개 힌트, 일본어 IME 지원, PDF 처리 및 API 요청 버그 수정을 포함한 중요한 개선 사항과 함께 출시되었습니다.

연구에 따르면 AI 사용자들은 종종 LLM의 답변을 확인 없이 수용하는 것으로 나타났습니다.
펜실베이니아 대학교 연구에서 AI 사용자들이 '인지적 항복'을 보이며, LLM 답변을 최소한의 검증 없이 수용한다는 사실을 발견했습니다. 실험에서 사용자들은 AI가 절반의 시간 동안 틀렸음에도 불구하고, 정확한 AI 답변을 93%의 확률로, 틀린 답변을 80%의 확률로 수용했습니다.