MCP Slim: Локальный поиск по эмбеддингам для инструментов MCP сокращает раздувание контекста

MCP Slim — это прокси-инструмент, который решает проблему раздувания контекста в MCP, заменяя полные каталоги инструментов тремя мета-инструментами: поиск, описание и вызов. Вместо загрузки всех определений инструментов заранее, LLM ищет то, что ему нужно, сокращая использование контекстного окна на 96%.
Ключевые детали
Инструмент специально нацелен на задокументированную проблему раздувания контекста в MCP, где подключение нескольких серверов может потреблять 55 000+ токенов на определения инструментов ещё до первого сообщения. Основное отличие MCP Slim от других прокси, таких как mcp-compressor и MCProxy, — использование семантического поиска с локальной моделью эмбеддингов MiniLM. Это позволяет находить релевантные инструменты без совпадения ключевых слов — например, «сохранить заметку» может найти create_entities.
Инструмент работает полностью офлайн и не требует API-ключей. Он совместим с любым stdio MCP клиентом, включая Claude Desktop, Cursor, Cline, Windsurf и Zed.
Установка и настройка
Установка выполняется через: npx mcp-slim init
Репозиторий на GitHub доступен по адресу: https://github.com/dopatools/mcp-slim
Автор (/u/OpportunitySpare2441) предложил отвечать на вопросы об архитектуре или компромиссах.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Сравнение 8 моделей ИИ для программирования на примере реализации реальной функции на TypeScript
Разработчик протестировал 8 моделей ИИ для программирования на задаче реализации команды /rename в проекте Telegram-бота на TypeScript с открытым исходным кодом, оценивая их по стоимости, времени выполнения, корректности и техническому качеству. GPT-5.4 показал наивысший результат по корректности реализации, а GLM 5 предложил наилучшее соотношение цены и производительности.

Фредди MCP Сервер подключает носимые устройства к ИИ-агентам с безголовым входом
Freddy — это персональный MCP-сервер, который связывает носимые устройства (Polar, Oura, Withings, Suunto, Intervals.icu, Hevy, а также WHOOP, Strava, Dexcom в бета-версии) с AI-клиентами, такими как Claude Code, ChatGPT и Notion AI, через OAuth. Новый headless-вход позволяет выполнять запланированные задачи для автономных агентов.

Инструмент Grape Root сокращает использование токенов кода Claude за счет кэширования контекста репозитория.
Бесплатный экспериментальный инструмент под названием Grape Root решает проблему избыточного потребления токенов в Claude Code, поддерживая легковесное состояние о ранее исследованных файлах репозитория, предотвращая ненужные повторные чтения неизмененных файлов при последующих запросах.
Claude создает прототип приложения для анализа недвижимости за 3 часа, используя живые данные Zillow через clawhub
Разработчик использовал Claude с инструментом zillow-full clawhub для создания приложения анализа денежного потока от аренды — получая данные через API Zillow в реальном времени, прототипируя UI на основе настоящих JSON-ответов и создав рабочий прототип за одну вторую половину дня.