MCP 슬림: MCP 도구를 위한 로컬 임베딩 검색으로 컨텍스트 비대화 감소

✍️ OpenClawRadar📅 게시일: April 17, 2026🔗 Source
MCP 슬림: MCP 도구를 위한 로컬 임베딩 검색으로 컨텍스트 비대화 감소
Ad

MCP Slim은 전체 도구 카탈로그를 검색, 설명, 호출이라는 세 가지 메타 도구로 대체하여 MCP의 컨텍스트 비대 문제를 해결하는 프록시 도구입니다. 모든 도구 정의를 미리 로드하는 대신, LLM이 필요한 것을 검색하여 컨텍스트 윈도우 사용량을 96% 줄입니다.

주요 세부 사항

이 도구는 특히 MCP의 문서화된 컨텍스트 비대 문제를 대상으로 합니다. 몇 개의 서버만 연결해도 첫 메시지 전에 도구 정의에 55,000개 이상의 토큰이 소비될 수 있습니다. MCP Slim이 mcp-compressor나 MCProxy와 같은 다른 프록시와 차별화되는 점은 로컬 MiniLM 임베딩 모델을 사용한 시맨틱 검색입니다. 이를 통해 키워드 중복 없이 관련 도구를 찾을 수 있습니다. 예를 들어, "메모 저장하기"가 create_entities를 찾을 수 있습니다.

이 도구는 완전히 오프라인에서 실행되며 API 키가 필요하지 않습니다. Claude Desktop, Cursor, Cline, Windsurf, Zed를 포함한 모든 stdio MCP 클라이언트와 호환됩니다.

설치 및 설정

설치는 다음 명령어로 수행됩니다: npx mcp-slim init

GitHub 저장소는 다음에서 확인할 수 있습니다: https://github.com/dopatools/mcp-slim

저자(/u/OpportunitySpare2441)는 아키텍처나 트레이드오프에 대한 질문에 답변할 의사가 있습니다.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Qwen3.6:27b + 맞춤형 Go 에이전트: Claude Code의 로컬 대안
Tools

Qwen3.6:27b + 맞춤형 Go 에이전트: Claude Code의 로컬 대안

한 개발자가 RTX 6000(96GB)에서 Q8 양자화된 Qwen3.6:27b를 테스트하고, 일상적인 코딩에 Claude Code와 비슷하다고 주장하며 플러그인이나 MCP 없는 최소한의 Go 에이전트를 오픈소스로 공개했습니다.

OpenClawRadar
engram v3.4.0, 새로운 속도 제한 하에서 Claude Code를 계속 실행할 수 있도록 Anthropic 플러그인 추가
Tools

engram v3.4.0, 새로운 속도 제한 하에서 Claude Code를 계속 실행할 수 있도록 Anthropic 플러그인 추가

engram v3.4.0은 Claude Code 전용 Anthropic 플러그인을 도입하여 비용 관리, 컨텍스트 조회, 오류 표시를 위한 3가지 스킬을 추가합니다. 설치: `/plugin install engram` 또는 `npm install -g engramx@latest`.

OpenClawRadar
Claude Pulse 브라우저 확장 프로그램, Claude.ai에 토큰 수, 캐시 타이머, 속도 제한 표시
Tools

Claude Pulse 브라우저 확장 프로그램, Claude.ai에 토큰 수, 캐시 타이머, 속도 제한 표시

Claude Pulse는 클라이언트 측 Chrome 확장 프로그램으로, Claude.ai에 메시지별 토큰 수, 전체 컨텍스트 사용량, 프롬프트 캐시 만료 타이머, 속도 제한 진행률 표시줄을 보여주는 실시간 대시보드를 추가합니다. 또한 채팅을 Markdown으로 내보낼 수 있습니다.

OpenClawRadar
코딩 에이전트 구축을 위한 8K 컨텍스트: 플래너/실행기 분할, 토큰 예산 및 병렬 실행
Tools

코딩 에이전트 구축을 위한 8K 컨텍스트: 플래너/실행기 분할, 토큰 예산 및 병렬 실행

8K 토큰 제한에 맞춰 설계된 CLI 코딩 에이전트의 상세 분석: 플래너/실행자 아키텍처, 엄격한 토크 예산, 병렬 작업 실행을 사용합니다.

OpenClawRadar