Плагин MCP с кэшированием промптов автоматически снижает затраты на API Claude, выявляя стабильный контекст.

✍️ OpenClawRadar📅 Опубликовано: 13 марта 2026 г.🔗 Source

Prompt-caching — это плагин MCP, который автоматически снижает стоимость API Claude, используя функцию кэширования Anthropic. При использовании Claude Code или Cursor/Windsurf/Zed с API Anthropic каждый запрос обычно повторно отправляет весь контекст с нуля, что означает, что тысячи токенов оплачиваются по полной ставке многократно во время длительных сессий отладки.

Как это работает

Anthropic предоставляет функцию кэширования, которая делает повторные чтения в 10 раз дешевле (0.1× вместо 1×), но это требует ручного указания, что кэшировать. Плагин prompt-caching работает в фоновом режиме, определяет стабильные части вашего контекста (системные промпты, определения инструментов, чтение больших файлов) и автоматически помечает их перед каждым вызовом API.

Результаты производительности

Исправление бага за 20 запросов: на 85% дешевле
Рефакторинг за 15 запросов: на 80% дешевле
Сессия программирования за 40 запросов: на 92% дешевле

Установка

Для пользователей Claude Code:

/plugin marketplace add https://github.com/flightlesstux/prompt-caching
/plugin install prompt-caching@ercan-ermis

Для Cursor/Windsurf/Zed:

npm install -g prompt-caching-mcp

Затем укажите на него в конфигурации MCP.

Инструмент имеет открытый исходный код под лицензией MIT и доступен бесплатно. Репозиторий находится по адресу https://github.com/flightlesstux/prompt-caching.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

Репозиторий Токенов: GitHub Action Добавляет Значок Подсчета Токенов для Осведомленности о Контекстном Окне LLM

Repo Tokens — это GitHub Action, который подсчитывает размер вашей кодовой базы в токенах с помощью tiktoken и добавляет в README значок, показывающий, какой процент контекстного окна языковой модели он заполняет. Значок использует зелёный цвет для менее 30%, жёлтый для 50-70% и красный для 70% и выше.

27 февр. 2026 г., 16:45 UTC

OpenClawRadar

Инструменты

Элодин публикует с открытым исходным кодом ИИ-гоночную упряжь с симуляцией Betaflight в реальном времени для участников AI Grand Prix

Elodin выпустил симуляционный харнас с открытым исходным кодом для виртуального квалификационного этапа AI Grand Prix, соответствующий условиям соревнований и работающий с реальным Betaflight. Инструмент на Rust/Bevy генерирует сэмплы камеры напрямую в цикле, избегая излишней нагрузки от игрового движка.

30 мая 2026 г., 00:17 UTC

OpenClawRadar

Инструменты

SWE-CI: Новые эталонные тесты оценивают ИИ-агентов в долгосрочном сопровождении кода через CI

SWE-CI — это бенчмарк на уровне репозитория, который оценивает агентов на основе LLM в поддержании кодовых баз через циклы непрерывной интеграции, смещая фокус со статического исправления ошибок на долгосрочную поддерживаемость в рамках 100 реальных задач.

8 мар. 2026 г., 13:45 UTC

OpenClawRadar

Инструменты

Инструмент границы утверждения для работы с репозиторием кода Claude

Разработчик создал инструмент для границы одобрения, который добавляет этап проверки перед локальным выполнением при использовании Claude Code для работы с репозиторием. Инструмент следует циклу: сначала увидеть план, одобрить один раз, позволить выполнению произойти локально и сохранить доказательство после этого.

19 апр. 2026 г., 09:45 UTC

OpenClawRadar