Prefex: Локальный прокси для Claude Code с кэшированием промптов

Prefex — это локальный прокси-инструмент, предназначенный для снижения затрат на API при использовании Claude Code. Он решает две конкретные проблемы неэффективности затрат: бета-функция кэширования промптов Anthropic требует ручного добавления заголовка, а Claude Code отправляет полную историю разговора с каждым запросом.

Как это работает

Prefex полностью работает на вашем локальном компьютере в качестве прокси между Claude Code и API Anthropic. Он автоматически добавляет конкретный заголовок, необходимый для активации функции кэширования промптов Anthropic, которая снижает затраты на повторяющиеся входные токены на 90%. Без этого заголовка все запросы, включая ваш CLAUDE.md и контекст проекта, тарифицируются по полной цене.

Инструмент также реализует сессионную память, предотвращая повторную отправку Claude Code всей истории разговора на каждом шаге. Кроме того, он включает маршрутизатор моделей, который может направлять более простые запросы на более дешёвые модели, хотя эта функция не была активна в течение начального периода тестирования.

Производительность и установка

В 4-дневном тесте при обычном использовании:

Обработано 1 338 запросов
Фактическая стоимость с Prefex: $49,60
Расчётная стоимость без Prefex: $348
Достигнута экономия 86% (только с кэшированием, без маршрутизации моделей)

Разработчик предоставляет тест, который запускает 5 вопросов на karpathy/nanoGPT с холодным и тёплым стартом, стоимостью примерно $0,03. Расчёты затрат используют фактические поля биллинга Anthropic.

Для установки требуется одна команда curl и добавление одной строки в settings.json. Пакет включает скрипт удаления. Инструмент работает локально без внешних серверов, без телеметрии, а ключи API отправляются напрямую в Anthropic.

📖 Read the full source: r/ClaudeAI

Prefex: Локальный прокси для кода Claude, автоматизирующий кэширование промптов и управление памятью сессий

Как это работает

Производительность и установка

👀 Смотрите также

Навык агента по современному CSS: Внедрение современных практик CSS в AI-кодинг-агенты

VSCode-Perplexity-MCP: используйте свою учетную запись Perplexity для бесплатного AI-поиска в VS Code

OnUI: Расширение для браузера для точной обратной связи по интерфейсу в Claude Code

MCP-Loci: Сервер локальной постоянной памяти для Claude и совместимых с MCP ИИ