Плагин MCP с кэшированием промптов автоматически снижает затраты на API Claude, выявляя стабильный контекст.

Prompt-caching — это плагин MCP, который автоматически снижает стоимость API Claude, используя функцию кэширования Anthropic. При использовании Claude Code или Cursor/Windsurf/Zed с API Anthropic каждый запрос обычно повторно отправляет весь контекст с нуля, что означает, что тысячи токенов оплачиваются по полной ставке многократно во время длительных сессий отладки.
Как это работает
Anthropic предоставляет функцию кэширования, которая делает повторные чтения в 10 раз дешевле (0.1× вместо 1×), но это требует ручного указания, что кэшировать. Плагин prompt-caching работает в фоновом режиме, определяет стабильные части вашего контекста (системные промпты, определения инструментов, чтение больших файлов) и автоматически помечает их перед каждым вызовом API.
Результаты производительности
- Исправление бага за 20 запросов: на 85% дешевле
- Рефакторинг за 15 запросов: на 80% дешевле
- Сессия программирования за 40 запросов: на 92% дешевле
Установка
Для пользователей Claude Code:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis
Для Cursor/Windsurf/Zed:
npm install -g prompt-caching-mcp
Затем укажите на него в конфигурации MCP.
Инструмент имеет открытый исходный код под лицензией MIT и доступен бесплатно. Репозиторий находится по адресу https://github.com/flightlesstux/prompt-caching.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

W2A — открытый протокол для агентских сенсоров: предоставление локальным агентам восприятия в реальном времени
W2A (World2Agent) — это открытый протокол, стандартизирующий уровень восприятия для AI-агентов: возможность самостоятельного хостинга, TS SDK, лицензия Apache 2.0. Он позволяет агентам получать сигналы от датчиков в реальном времени без одноразовых скриптов.

Tilde.run: Песочница для агентов с транзакционной версионированной файловой системой
Tilde.run предоставляет изолированные, обратимые песочницы для AI-агентов, с версионируемой файловой системой, которая монтирует GitHub, S3 и Google Drive, и сетевой изоляцией по умолчанию.

SmallClaw V1.0.3 добавляет поддержку Webhooks, автоматизацию n8n и сервер MCP.
SmallClaw V1.0.3 представляет вебхук-эндпоинты для триггеров внешних сервисов, локальные рабочие процессы автоматизации с n8n и подключения к MCP-серверам для интеграции инструментов. Обновление сохраняет фокус инструмента на работе с небольшими локальными LLM.

Скраплинг интегрирован как основа для скрапинга OpenClaw.
Scrapling, библиотека с открытым исходным кодом, которая изучает структуру страницы и адаптируется к изменениям, была интегрирована в OpenClaw в качестве основного движка для скрапинга. Она работает в 774 раза быстрее, чем BeautifulSoup с Lxml, и поддерживает несколько типов селекторов с асинхронными сессиями.