단일 호출 MCP 파이프라인이 Claude Code 토큰 사용량을 74% 감소시킵니다

✍️ OpenClawRadar📅 게시일: March 1, 2026🔗 Source
단일 호출 MCP 파이프라인이 Claude Code 토큰 사용량을 74% 감소시킵니다
Ad

한 개발자가 Claude Code에 코드베이스의 의존성 그래프를 제공하여 전체 파일 대신 관련 코드만 읽을 수 있게 하는 컨텍스트 엔진(MCP 서버)을 구축한 경험을 공유했습니다. 이 도구는 원본 파일 대신 의존성 그래프와 스켈레톤을 제공함으로써 토큰 사용량을 크게 줄입니다.

원래 문제와 초기 해결책

Claude Code는 일반적으로 전체 파일을 읽고 모든 내용을 컨텍스트에 덤프하여 토큰을 빠르게 소모합니다. 초기 접근 방식은 MCP를 통해 원본 파일 대신 의존성 그래프와 스켈레톤만 제공하여 관련 코드만 서비스하는 것이었으며, 이것만으로도 토큰 사용량을 65% 줄였습니다.

발견된 비효율성과 해결책

사용자들은 MCP 워크플로우 자체가 비효율적이라고 지적했습니다. 에이전트가 여러 번 왕복 호출을 수행했기 때문입니다: get_context_capsule 호출, 결과 읽기, 그 다음 get_impact_graph 호출, 결과 읽기, 이어서 search_memory 호출, 그리고 결과 읽기. 이로 인해 컨텍스트에 중복 결과가 포함된 세 번의 왕복 호출이 발생했습니다.

run_pipeline 수정

개발자는 다단계 워크플로우를 대체하는 run_pipeline이라는 단일 호출 MCP 도구를 출시했습니다. 이 도구는 의도(디버그/수정/리팩터링/탐색)를 자동으로 감지하고 서버 측에서 적절한 컨텍스트 검색, 영향 분석, 메모리 회상 조합을 실행합니다.

run_pipeline({
  task: "JWT 검증 버그 수정",
  preset: "auto",
  max_tokens: 10000,
  observation: "JWT가 Ed25519 사용" // 같은 호출에서 통찰 저장
})

이 단일 호출은 3-4개의 개별 호출을 대체합니다. 결과는 중복 제거되고 토큰 예산 내에서 병합되어 컨텍스트 창에 도달하기 전에 처리되며, 개별 도구를 호출하는 것에 비해 약 60% 적은 컨텍스트 토큰을 사용합니다. observation 매개변수를 통해 에이전트는 별도의 save_observation 단계 없이 같은 호출에서 학습된 정보를 저장할 수 있습니다. 메모리는 코드 그래프 노드에 연결되어 있어 코드가 변경되면 관찰 내용이 자동으로 오래된 것으로 표시됩니다.

Ad

추가로 출시된 기능

  • 수동 관찰 파이프라인: 파일 감시자 → blake3 해시 차이 → AST 수준 구조적 차이 → 도구 호출과의 자동 상관 관계 → 제로 구성 관찰
  • VS Code 없이 작동하는 CLI: npm install -g vexp-cli
  • 기존 훅을 덮어쓰지 않는 Git 훅(마커로 구분된 블록)
  • VS Code 사이드바에 표시되는 토큰 절약량(24시간 롤링 윈도우와 실제 숫자)

사용 가능성

이 도구는 2,000개의 노드, 기본 파이프라인 기능, 완전한 세션 메모리를 제공하는 관대한 무료 티어로 무료로 사용해 볼 수 있습니다. 계정이나 API 키가 필요하지 않으며 네트워크 호출을 전혀 하지 않습니다. 핵심 아키텍처에는 개발자가 구축한 Rust 그래프 엔진과 tree-sitter 파서가 포함되어 있으며, Claude Code는 MCP 프로토콜 레이어, SQLite 스키마 마이그레이션, 에이전트 지시 템플릿 작업을 지원합니다.

📖 전체 소스 읽기: r/ClaudeAI

Ad

👀 See Also

클로드 코드 저장소 작업용 승인 경계 도구
Tools

클로드 코드 저장소 작업용 승인 경계 도구

한 개발자가 Claude Code를 사용한 저장소 작업 시 로컬 실행 전에 검토 단계를 추가하는 승인 경계 도구를 만들었습니다. 이 도구는 계획을 먼저 확인하고, 한 번 승인하며, 로컬에서 실행이 진행되도록 하고, 이후 증거를 보관하는 루프를 따릅니다.

OpenClawRadar
AI 코딩 에이전트를 위한 교차 모델 검토 루프가 치명적인 계획 결함을 포착합니다
Tools

AI 코딩 에이전트를 위한 교차 모델 검토 루프가 치명적인 계획 결함을 포착합니다

한 개발자가 코딩 에이전트의 계획을 실행 전에 두 번째 AI 모델이 검토하는 교차 모델 검토 시스템을 구축했습니다. 이 시스템은 롤백 실패와 보안 허점 같은 치명적 결함을 포착합니다. 이 도구는 MIT 라이선스로 배포되며 TUI 대시보드를 포함합니다.

OpenClawRadar
오픈소스 MCP 메모리 서버 - 지식 그래프 및 학습 기능 포함
Tools

오픈소스 MCP 메모리 서버 - 지식 그래프 및 학습 기능 포함

Rust로 작성된 오픈소스 MCP 서버가 지식 그래프 아키텍처, 헤비안 학습, 하이브리드 검색을 통해 AI 에이전트에 지속적 메모리를 제공합니다. 7.6MB 크기에 밀리초 미만의 지연 시간을 가지며 모든 MCP 호환 클라이언트와 작동합니다.

OpenClawRadar
보데가 추론 엔진: Apple Silicon의 통합 메모리를 위한 LLM 추론 최적화
Tools

보데가 추론 엔진: Apple Silicon의 통합 메모리를 위한 LLM 추론 최적화

Bodega는 Apple Silicon의 통합 메모리 아키텍처를 위해 특별히 구축된 추론 엔진으로, MLX에서 연속 배칭과 KV 캐시 관리를 재설계하여 처리량 한계를 해결합니다. 개발자는 Metal 레이어에 가까운 최적화와 함께 2.5년 동안 작업했다고 보고합니다.

OpenClawRadar