단일 호출 MCP 파이프라인으로 Claude Code 토큰 74% 절감

한 개발자가 Claude Code에 코드베이스의 의존성 그래프를 제공하여 전체 파일 대신 관련 코드만 읽을 수 있게 하는 컨텍스트 엔진(MCP 서버)을 구축한 경험을 공유했습니다. 이 도구는 원본 파일 대신 의존성 그래프와 스켈레톤을 제공함으로써 토큰 사용량을 크게 줄입니다.

원래 문제와 초기 해결책

Claude Code는 일반적으로 전체 파일을 읽고 모든 내용을 컨텍스트에 덤프하여 토큰을 빠르게 소모합니다. 초기 접근 방식은 MCP를 통해 원본 파일 대신 의존성 그래프와 스켈레톤만 제공하여 관련 코드만 서비스하는 것이었으며, 이것만으로도 토큰 사용량을 65% 줄였습니다.

발견된 비효율성과 해결책

사용자들은 MCP 워크플로우 자체가 비효율적이라고 지적했습니다. 에이전트가 여러 번 왕복 호출을 수행했기 때문입니다: get_context_capsule 호출, 결과 읽기, 그 다음 get_impact_graph 호출, 결과 읽기, 이어서 search_memory 호출, 그리고 결과 읽기. 이로 인해 컨텍스트에 중복 결과가 포함된 세 번의 왕복 호출이 발생했습니다.

run_pipeline 수정

개발자는 다단계 워크플로우를 대체하는 run_pipeline이라는 단일 호출 MCP 도구를 출시했습니다. 이 도구는 의도(디버그/수정/리팩터링/탐색)를 자동으로 감지하고 서버 측에서 적절한 컨텍스트 검색, 영향 분석, 메모리 회상 조합을 실행합니다.

run_pipeline({
  task: "JWT 검증 버그 수정",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT가 Ed25519 사용" // 같은 호출에서 통찰 저장
})

이 단일 호출은 3-4개의 개별 호출을 대체합니다. 결과는 중복 제거되고 토큰 예산 내에서 병합되어 컨텍스트 창에 도달하기 전에 처리되며, 개별 도구를 호출하는 것에 비해 약 60% 적은 컨텍스트 토큰을 사용합니다. observation 매개변수를 통해 에이전트는 별도의 save_observation 단계 없이 같은 호출에서 학습된 정보를 저장할 수 있습니다. 메모리는 코드 그래프 노드에 연결되어 있어 코드가 변경되면 관찰 내용이 자동으로 오래된 것으로 표시됩니다.

추가로 출시된 기능

수동 관찰 파이프라인: 파일 감시자 → blake3 해시 차이 → AST 수준 구조적 차이 → 도구 호출과의 자동 상관 관계 → 제로 구성 관찰
VS Code 없이 작동하는 CLI: npm install -g vexp-cli
기존 훅을 덮어쓰지 않는 Git 훅(마커로 구분된 블록)
VS Code 사이드바에 표시되는 토큰 절약량(24시간 롤링 윈도우와 실제 숫자)

사용 가능성

이 도구는 2,000개의 노드, 기본 파이프라인 기능, 완전한 세션 메모리를 제공하는 관대한 무료 티어로 무료로 사용해 볼 수 있습니다. 계정이나 API 키가 필요하지 않으며 네트워크 호출을 전혀 하지 않습니다. 핵심 아키텍처에는 개발자가 구축한 Rust 그래프 엔진과 tree-sitter 파서가 포함되어 있으며, Claude Code는 MCP 프로토콜 레이어, SQLite 스키마 마이그레이션, 에이전트 지시 템플릿 작업을 지원합니다.

📖 전체 소스 읽기: r/ClaudeAI