모든 프롬프트에 모든 MCP 서버를 로딩하면 조용히 토큰 예산이 소진된다

✍️ OpenClawRadar📅 게시일: May 2, 2026🔗 Source
모든 프롬프트에 모든 MCP 서버를 로딩하면 조용히 토큰 예산이 소진된다
Ad

r/ClaudeAI의 게시물은 미묘하지만 비용이 많이 드는 문제를 보고합니다. 여러 MCP 서버가 구성된 경우, 기본적으로 모든 프롬프트가 모든 서버를 로드하며, 이는 사소한 질문에도 해당됩니다. 사용자는 5~6개의 서버를 사용하고 있었지만 토큰 사용량을 확인할 때까지 이를 인지하지 못했습니다. 매번 프롬프트가 관련 없는 서버 정의를 로드하는 데 토큰을 낭비하고 있었던 것입니다.

핵심 세부 사항

  • 모든 프롬프트가 전체 MCP 서버 세트(5~6개 서버)를 로드했습니다.
  • 간단한 프롬프트(예: "지금 몇 시야?")조차 모든 서버 정의를 불러왔습니다.
  • 해결책: 프롬프트와 관련된 서버만 선택하는 사용자 정의 라우팅 레이어를 구현했습니다.
  • 결과: 토큰 사용량이 크게 줄고 프롬프트 응답 시간이 개선되었습니다.
  • 작성자는 "확인하지 않고 이렇게 오래 방치했다는 사실을 믿을 수 없다"고 인정했습니다.

기술적 배경

MCP(Model Context Protocol) 서버는 Claude의 기능(예: 파일 시스템 액세스, 데이터베이스 쿼리, 웹 스크래핑)을 확장하는 도구입니다. 포크된 클라이언트 및 수동 구성을 포함한 많은 설정에서 기본 동작은 각 메시지에 전체 서버 정의 목록을 전송하는 것입니다. 즉, DB 액세스, 파일 I/O, 웹 브라우징 등을 위한 도구가 실제 사용자 입력이 처리되기 전에 모두 컨텍스트 창에 덤프됩니다.

라우팅 레이어는 사용자 메시지(또는 시스템 프롬프트)를 검사하고 설명이나 도구가 의도와 일치하는 MCP 서버만 조건부로 포함할 수 있습니다. 예를 들어, 파일 경로를 언급하는 프롬프트는 파일 도구를 활성화하고, 주식 가격에 대한 질문은 금융 서버만 로드합니다. 이를 통해 관련 없는 서버 메타데이터의 토큰 오버헤드를 피할 수 있습니다.

이 정보가 필요한 사람

특히 토큰 효율성이 중요한 자동화 파이프라인이나 사용자 정의 프론트엔드에서 여러 MCP 서버와 함께 Claude를 실행하는 개발자.

📖 전체 출처 읽기: r/ClaudeAI

Ad

👀 See Also

OpenClaw 예약/크론잡 작업이 실패하는 이유
Tips

OpenClaw 예약/크론잡 작업이 실패하는 이유

OpenClaw에서 에이전트에게 예약 작업을 요청하면 종종 OpenClaw의 프롬프트-인-크론 기능 대신 셸 또는 파이썬 스크립트를 생성합니다. 이로 인해 작업이 비에이전트 방식이 되어 비효율적입니다.

OpenClawRadar
예/아니오 흐름: AI 코딩 세션에서 맥락 환각을 줄이는 간단한 기법
Tips

예/아니오 흐름: AI 코딩 세션에서 맥락 환각을 줄이는 간단한 기법

레딧 사용자가 AI 대화에서 일관성을 유지하기 위한 Yes Flow/No Flow 기법을 공유합니다. 이 기법은 수정을 쌓아올리기보다 프롬프트를 재작성하여 장기 코딩 세션 중 컨텍스트 붕괴와 환각을 줄이는 데 도움을 줍니다.

OpenClawRadar
현장 보고서: M2 맥북 프로(32GB)에서의 Qwen 3.6 27B – 느리지만 스마트한 출력
Tips

현장 보고서: M2 맥북 프로(32GB)에서의 Qwen 3.6 27B – 느리지만 스마트한 출력

M2 맥북 프로(32GB RAM)에서 Qwen 3.6 27B IQ4_XS를 실행하면 초기 7.9 t/s에서 52k 컨텍스트에서 3.1 t/s로 성능이 저하됩니다. 코드 품질은 인상적이지만 메모리 대역폭이 병목입니다.

OpenClawRadar
클로드 코드: 프롬프트 엔지니어링보다 컨텍스트 관리
Tips

클로드 코드: 프롬프트 엔지니어링보다 컨텍스트 관리

한 개발자가 Claude Code를 1년간 사용한 후 깨달은 핵심 기술은 프롬프트 작성법이나 모델 선택이 아니라, 더 나은 결과를 얻기 위해 사전에 포괄적인 프로젝트 컨텍스트를 제공하는 것이라고 밝혔습니다.

OpenClawRadar