MCP Slim: Локальный поиск по эмбеддингам для инструментов MCP сокращает раздувание контекста

✍️ OpenClawRadar📅 Опубликовано: 17 апреля 2026 г.🔗 Source
MCP Slim: Локальный поиск по эмбеддингам для инструментов MCP сокращает раздувание контекста
Ad

MCP Slim — это прокси-инструмент, который решает проблему раздувания контекста в MCP, заменяя полные каталоги инструментов тремя мета-инструментами: поиск, описание и вызов. Вместо загрузки всех определений инструментов заранее, LLM ищет то, что ему нужно, сокращая использование контекстного окна на 96%.

Ключевые детали

Инструмент специально нацелен на задокументированную проблему раздувания контекста в MCP, где подключение нескольких серверов может потреблять 55 000+ токенов на определения инструментов ещё до первого сообщения. Основное отличие MCP Slim от других прокси, таких как mcp-compressor и MCProxy, — использование семантического поиска с локальной моделью эмбеддингов MiniLM. Это позволяет находить релевантные инструменты без совпадения ключевых слов — например, «сохранить заметку» может найти create_entities.

Инструмент работает полностью офлайн и не требует API-ключей. Он совместим с любым stdio MCP клиентом, включая Claude Desktop, Cursor, Cline, Windsurf и Zed.

Ad

Установка и настройка

Установка выполняется через: npx mcp-slim init

Репозиторий на GitHub доступен по адресу: https://github.com/dopatools/mcp-slim

Автор (/u/OpportunitySpare2441) предложил отвечать на вопросы об архитектуре или компромиссах.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Сравнение 8 моделей ИИ для программирования на примере реализации реальной функции на TypeScript
Инструменты

Сравнение 8 моделей ИИ для программирования на примере реализации реальной функции на TypeScript

Разработчик протестировал 8 моделей ИИ для программирования на задаче реализации команды /rename в проекте Telegram-бота на TypeScript с открытым исходным кодом, оценивая их по стоимости, времени выполнения, корректности и техническому качеству. GPT-5.4 показал наивысший результат по корректности реализации, а GLM 5 предложил наилучшее соотношение цены и производительности.

OpenClawRadar
Фредди MCP Сервер подключает носимые устройства к ИИ-агентам с безголовым входом
Инструменты

Фредди MCP Сервер подключает носимые устройства к ИИ-агентам с безголовым входом

Freddy — это персональный MCP-сервер, который связывает носимые устройства (Polar, Oura, Withings, Suunto, Intervals.icu, Hevy, а также WHOOP, Strava, Dexcom в бета-версии) с AI-клиентами, такими как Claude Code, ChatGPT и Notion AI, через OAuth. Новый headless-вход позволяет выполнять запланированные задачи для автономных агентов.

OpenClawRadar
Инструмент Grape Root сокращает использование токенов кода Claude за счет кэширования контекста репозитория.
Инструменты

Инструмент Grape Root сокращает использование токенов кода Claude за счет кэширования контекста репозитория.

Бесплатный экспериментальный инструмент под названием Grape Root решает проблему избыточного потребления токенов в Claude Code, поддерживая легковесное состояние о ранее исследованных файлах репозитория, предотвращая ненужные повторные чтения неизмененных файлов при последующих запросах.

OpenClawRadar
🦀
Инструменты

Claude создает прототип приложения для анализа недвижимости за 3 часа, используя живые данные Zillow через clawhub

Разработчик использовал Claude с инструментом zillow-full clawhub для создания приложения анализа денежного потока от аренды — получая данные через API Zillow в реальном времени, прототипируя UI на основе настоящих JSON-ответов и создав рабочий прототип за одну вторую половину дня.

OpenClawRadar