MCP 슬림: MCP 도구를 위한 로컬 임베딩 검색으로 컨텍스트 비대화 감소

MCP Slim은 전체 도구 카탈로그를 검색, 설명, 호출이라는 세 가지 메타 도구로 대체하여 MCP의 컨텍스트 비대 문제를 해결하는 프록시 도구입니다. 모든 도구 정의를 미리 로드하는 대신, LLM이 필요한 것을 검색하여 컨텍스트 윈도우 사용량을 96% 줄입니다.
주요 세부 사항
이 도구는 특히 MCP의 문서화된 컨텍스트 비대 문제를 대상으로 합니다. 몇 개의 서버만 연결해도 첫 메시지 전에 도구 정의에 55,000개 이상의 토큰이 소비될 수 있습니다. MCP Slim이 mcp-compressor나 MCProxy와 같은 다른 프록시와 차별화되는 점은 로컬 MiniLM 임베딩 모델을 사용한 시맨틱 검색입니다. 이를 통해 키워드 중복 없이 관련 도구를 찾을 수 있습니다. 예를 들어, "메모 저장하기"가 create_entities를 찾을 수 있습니다.
이 도구는 완전히 오프라인에서 실행되며 API 키가 필요하지 않습니다. Claude Desktop, Cursor, Cline, Windsurf, Zed를 포함한 모든 stdio MCP 클라이언트와 호환됩니다.
설치 및 설정
설치는 다음 명령어로 수행됩니다: npx mcp-slim init
GitHub 저장소는 다음에서 확인할 수 있습니다: https://github.com/dopatools/mcp-slim
저자(/u/OpportunitySpare2441)는 아키텍처나 트레이드오프에 대한 질문에 답변할 의사가 있습니다.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Qwen3.6:27b + 맞춤형 Go 에이전트: Claude Code의 로컬 대안
한 개발자가 RTX 6000(96GB)에서 Q8 양자화된 Qwen3.6:27b를 테스트하고, 일상적인 코딩에 Claude Code와 비슷하다고 주장하며 플러그인이나 MCP 없는 최소한의 Go 에이전트를 오픈소스로 공개했습니다.

engram v3.4.0, 새로운 속도 제한 하에서 Claude Code를 계속 실행할 수 있도록 Anthropic 플러그인 추가
engram v3.4.0은 Claude Code 전용 Anthropic 플러그인을 도입하여 비용 관리, 컨텍스트 조회, 오류 표시를 위한 3가지 스킬을 추가합니다. 설치: `/plugin install engram` 또는 `npm install -g engramx@latest`.

Claude Pulse 브라우저 확장 프로그램, Claude.ai에 토큰 수, 캐시 타이머, 속도 제한 표시
Claude Pulse는 클라이언트 측 Chrome 확장 프로그램으로, Claude.ai에 메시지별 토큰 수, 전체 컨텍스트 사용량, 프롬프트 캐시 만료 타이머, 속도 제한 진행률 표시줄을 보여주는 실시간 대시보드를 추가합니다. 또한 채팅을 Markdown으로 내보낼 수 있습니다.

코딩 에이전트 구축을 위한 8K 컨텍스트: 플래너/실행기 분할, 토큰 예산 및 병렬 실행
8K 토큰 제한에 맞춰 설계된 CLI 코딩 에이전트의 상세 분석: 플래너/실행자 아키텍처, 엄격한 토크 예산, 병렬 작업 실행을 사용합니다.