Prefex: Локальный прокси для кода Claude, автоматизирующий кэширование промптов и управление памятью сессий

Prefex — это локальный прокси-инструмент, предназначенный для снижения затрат на API при использовании Claude Code. Он решает две конкретные проблемы неэффективности затрат: бета-функция кэширования промптов Anthropic требует ручного добавления заголовка, а Claude Code отправляет полную историю разговора с каждым запросом.
Как это работает
Prefex полностью работает на вашем локальном компьютере в качестве прокси между Claude Code и API Anthropic. Он автоматически добавляет конкретный заголовок, необходимый для активации функции кэширования промптов Anthropic, которая снижает затраты на повторяющиеся входные токены на 90%. Без этого заголовка все запросы, включая ваш CLAUDE.md и контекст проекта, тарифицируются по полной цене.
Инструмент также реализует сессионную память, предотвращая повторную отправку Claude Code всей истории разговора на каждом шаге. Кроме того, он включает маршрутизатор моделей, который может направлять более простые запросы на более дешёвые модели, хотя эта функция не была активна в течение начального периода тестирования.
Производительность и установка
В 4-дневном тесте при обычном использовании:
- Обработано 1 338 запросов
- Фактическая стоимость с Prefex: $49,60
- Расчётная стоимость без Prefex: $348
- Достигнута экономия 86% (только с кэшированием, без маршрутизации моделей)
Разработчик предоставляет тест, который запускает 5 вопросов на karpathy/nanoGPT с холодным и тёплым стартом, стоимостью примерно $0,03. Расчёты затрат используют фактические поля биллинга Anthropic.
Для установки требуется одна команда curl и добавление одной строки в settings.json. Пакет включает скрипт удаления. Инструмент работает локально без внешних серверов, без телеметрии, а ключи API отправляются напрямую в Anthropic.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Skillware добавляет генератор синтетических данных с оценкой энтропии для тонкой настройки локальных моделей.
Skillware выпустила новый навык генератора синтетических данных, который использует эвристики коэффициента сжатия zlib для оценки разнообразия вывода, помогая предотвратить коллапс модели. Инструмент работает из коробки с Ollama, поддерживает Gemini/Anthropic для высокоуровневых пакетов рассуждений и выводит JSON-пакеты для конвейеров тонкой настройки .jsonl.

Utilyze: Монитор GPU с открытым исходным кодом, измеряющий реальную вычислительную пропускную способность, а не только активность ядра
Utilyze выбирает образцы аппаратных счетчиков производительности, чтобы сообщать вычислительную и памятьную пропускную способность относительно теоретических пределов, показывая, что панели с 100% загрузкой могут иметь всего 1-10% реальной пропускной способности.

Пользовательский PTC для Claude Code демонстрирует экономию токенов в 40–65% на задачах анализа, но не на написании кода.
Разработчик создал локальную реализацию PTC под названием Thalamus для Claude Code и проанализировал 79 реальных сессий, обнаружив экономию токенов в 40-65% на аналитических задачах, но почти нулевую экономию на задачах написания кода. Агент использовал execute() в основном для общих вычислений на Python, а не для пакетного вызова инструментов.

Интеграция WordPress.com MCP добавляет возможности записи для Claude
Интеграция WordPress.com с MCP теперь поддерживает операции записи, позволяя Claude создавать черновики постов, строить страницы, управлять комментариями, исправлять альтернативный текст изображений и реструктурировать категории контента непосредственно на сайтах WordPress.com. Перед созданием контента Claude читает тему сайта, чтобы понять элементы дизайна, такие как цвета, шрифты и шаблоны блоков.