클로드 AI 세션 압축 문제 및 해결 방법

압축 작동 방식
Claude 세션은 ~/.claude/projects/{encoded-cwd}/sessions/{id}.jsonl 경로에 JSONL 파일로 저장됩니다. 각 대화 턴은 JSON 블록입니다. 압축이 트리거되면 원본 블록은 파일에 그대로 남아 있지만, 압축된 요약이 포함된 새 블록이 추가됩니다. 압축 후 모델은 전체 대화 기록 대신 요약을 기반으로 작동합니다.
테스트 결과
코딩 프로젝트를 컨텍스트 채우기 90%(100만 토큰 증가 전) 상태에서 사용자는 단순 회상, 6단계 종속성 체인, 엔티티 명확화, 부정 체이닝, 부재 감지, 충돌 감지를 포함한 10가지 질문으로 테스트했습니다.
- 압축 전: Opus 4.6이 418K 토큰에 흩어진 사실을 찾아내며 약 9.75/10 정확도
- 압축 후 (기본): 3,461 토큰(121배 압축)으로 약 5/10 정확도. 동일 세션, 동일 질문에서 잘못된 답변을 환각하는 결과 발생
- 압축 후 (수동 Opus): 6,080 토큰(69배 압축)으로 약 9.75/10 정확도. 사용자 정의 압축 프롬프트와 Opus를 사용하여 중요한 정보 보존
차이점의 원인
Anthropic의 문서에 따르면, API는 기본적으로 동일 모델을 압축에 사용합니다. 사용자가 중간 컴퓨팅에서 Opus 4.6을 실행 중이었으므로 기본 압축도 Opus를 사용했어야 합니다. 품질 차이는 요약 프롬프트, 사고/컴퓨팅 예산, 또는 둘 모두에 문제가 있음을 시사합니다.
해결 방법
방법 1: Opus 압축 - 자동 압축을 끄고 Claude Code 인스턴스의 토큰 수를 측정하는 백그라운드 프로세스를 구현합니다. 사용자 정의 프롬프트(사용자 승인 가능)와 함께 Opus를 사용하여 압축을 트리거합니다.
방법 2: spaCy NER 사전 시딩 - 하위 에이전트를 제로 컨텍스트로 시작하는 대신, spaCy NER을 사용하여 프로젝트 파일에서 고유 명사, 숫자, 서비스 이름, 포트, 주요 식별자를 추출합니다. 이를 시작 시 경량 엔티티 브리핑(수백 토큰)으로 주입하여 서술적 부풀림 없이 기존 리소스에 대해 에이전트에게 알립니다.
📖 Read the full source: r/ClaudeAI
👀 See Also

ClawHost 오픈소스 OpenClaw 원클릭 배포, GitHub 스타 200+ 돌파
ClawHost는 전체 서버 접근 및 제어 기능을 갖춘 원클릭 OpenClaw 설치를 위한 오픈소스 도구로, 200개 이상의 GitHub 스타를 달성했습니다. 이 프로젝트는 불안정한 상용 래퍼의 문제를 해결하기 위해 무료로 자체 호스팅 가능한 솔루션을 제공합니다.

Engram v1.0.0: 로컬 LLM을 위한 지식 그래프 기반 영구 메모리
Engram은 지식 그래프 시스템을 통해 로컬 LLM에 지속적인 메모리를 제공하는 단일 바이너리입니다. Claude Code, Cursor, Windsurf와의 통합을 위한 MCP 서버를 포함하며, 모든 데이터를 단일 .brain 파일에 저장하고 완전히 오프라인에서 실행됩니다.

레딧 사용자가 MCP 토큰 오버헤드를 측정: 질문 전에 67K 토큰 소모됨
한 개발자가 MCP 서버 토큰 오버헤드를 측정한 결과, 단일 질문을 입력하기 전에 67,000개의 토큰이 소비되었으며, Playwright MCP는 13,600개의 토큰을, GitHub MCP는 18,000개의 토큰을 유휴 상태에서 사용했습니다. 이들은 더 낮은 컨텍스트 비용을 위해 MCP를 스킬과 CLI 도구로 대체했습니다.

Vektori의 메모리 아키텍처: Claude의 유출된 시스템 원칙
Vektori는 Claude의 아키텍처에서 유출된 원칙에서 영감을 받아 AI 메모리를 위한 3계층 계층적 문장 그래프를 구현합니다. 이 시스템은 엄격한 품질 필터, 0.3 최소 점수의 회의적 검색을 사용하며 세션 간 수정 기록을 유지합니다.