Плагин MCP с кэшированием промптов автоматически снижает затраты на API Claude, выявляя стабильный контекст.

Prompt-caching — это плагин MCP, который автоматически снижает стоимость API Claude, используя функцию кэширования Anthropic. При использовании Claude Code или Cursor/Windsurf/Zed с API Anthropic каждый запрос обычно повторно отправляет весь контекст с нуля, что означает, что тысячи токенов оплачиваются по полной ставке многократно во время длительных сессий отладки.
Как это работает
Anthropic предоставляет функцию кэширования, которая делает повторные чтения в 10 раз дешевле (0.1× вместо 1×), но это требует ручного указания, что кэшировать. Плагин prompt-caching работает в фоновом режиме, определяет стабильные части вашего контекста (системные промпты, определения инструментов, чтение больших файлов) и автоматически помечает их перед каждым вызовом API.
Результаты производительности
- Исправление бага за 20 запросов: на 85% дешевле
- Рефакторинг за 15 запросов: на 80% дешевле
- Сессия программирования за 40 запросов: на 92% дешевле
Установка
Для пользователей Claude Code:
/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis
Для Cursor/Windsurf/Zed:
npm install -g prompt-caching-mcp
Затем укажите на него в конфигурации MCP.
Инструмент имеет открытый исходный код под лицензией MIT и доступен бесплатно. Репозиторий находится по адресу https://github.com/flightlesstux/prompt-caching.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Репозиторий Токенов: GitHub Action Добавляет Значок Подсчета Токенов для Осведомленности о Контекстном Окне LLM
Repo Tokens — это GitHub Action, который подсчитывает размер вашей кодовой базы в токенах с помощью tiktoken и добавляет в README значок, показывающий, какой процент контекстного окна языковой модели он заполняет. Значок использует зелёный цвет для менее 30%, жёлтый для 50-70% и красный для 70% и выше.

Элодин публикует с открытым исходным кодом ИИ-гоночную упряжь с симуляцией Betaflight в реальном времени для участников AI Grand Prix
Elodin выпустил симуляционный харнас с открытым исходным кодом для виртуального квалификационного этапа AI Grand Prix, соответствующий условиям соревнований и работающий с реальным Betaflight. Инструмент на Rust/Bevy генерирует сэмплы камеры напрямую в цикле, избегая излишней нагрузки от игрового движка.

SWE-CI: Новые эталонные тесты оценивают ИИ-агентов в долгосрочном сопровождении кода через CI
SWE-CI — это бенчмарк на уровне репозитория, который оценивает агентов на основе LLM в поддержании кодовых баз через циклы непрерывной интеграции, смещая фокус со статического исправления ошибок на долгосрочную поддерживаемость в рамках 100 реальных задач.

Инструмент границы утверждения для работы с репозиторием кода Claude
Разработчик создал инструмент для границы одобрения, который добавляет этап проверки перед локальным выполнением при использовании Claude Code для работы с репозиторием. Инструмент следует циклу: сначала увидеть план, одобрить один раз, позволить выполнению произойти локально и сохранить доказательство после этого.