Прокси с открытым исходным кодом RelayPlane демонстрирует снижение затрат на 73% благодаря маршрутизации моделей Claude.

✍️ OpenClawRadar📅 Опубликовано: 7 апреля 2026 г.🔗 Source

Открытый прокси для маршрутизации API Claude

RelayPlane — это открытый npm-нативный прокси, который располагается перед API Anthropic. Инструмент был создан с использованием Claude Code, что ускорило разработку. Его можно бесплатно разместить самостоятельно, и он предназначен для обработки маршрутизации между различными моделями Claude в зависимости от сложности запроса.

Результаты тестирования и конфигурация

В тестах использовалась смешанная нагрузка: 60% простых задач и 40% сложных задач. Были сравнены два сценария:

Прямой доступ (только Sonnet): p50 задержка 1,55 с, стоимость 10 запросов $0,0323
Через RelayPlane с маршрутизацией: p50 задержка 0,78 с, стоимость 10 запросов $0,0086

Это означает снижение затрат на 73,4%. При 10 000 запросов в день это соответствует примерно $712 ежемесячной экономии.

Конфигурация маршрутизации

Конфигурация маршрутизации проста:

{
  "routing": {
    "complexity": {
      "enabled": true,
      "simple": "claude-haiku-4-5",
      "moderate": "claude-sonnet-4-6",
      "complex": "claude-opus-4-6"
    }
  }
}

Логика маршрутизации использует классификатор сложности, который анализирует количество токенов, индикаторы кода и аналитические ключевые слова. Заголовки ответов включают x-relayplane-routed-model для проверки того, какая модель фактически обработала запрос.

Цены моделей и логика маршрутизации

Система маршрутизации направляет запросы к соответствующим моделям в зависимости от сложности:

Простые запросы → Haiku ($0,80 за миллион токенов)
Средние запросы → Sonnet ($3 за миллион токенов)
Сложные запросы → Opus ($15 за миллион токенов)

Автор отмечает, что классификатор не идеален, но «достаточно хорош, чтобы обеспечить большую часть экономии». Полная методология тестирования доступна в Gist, ссылка на который приведена в исходном материале.

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Инструменты

Prism MCP v2.1 добавляет постоянную память к сессиям Claude.

Prism MCP v2.1.0 'Дворец разума' обеспечивает постоянную память сессий для Claude, устраняя необходимость повторного объяснения контекста проекта. Он включает локальное хранилище SQLite, визуальный браузер памяти, откат состояния и синхронизацию контекста между клиентами.

20 мар. 2026 г., 23:45 UTC

OpenClawRadar

Инструменты

Тестирование показывает, что CLI-инструмент сокращает затраты на токены кода Claude на 32% благодаря структурной навигации.

Разработчик создал инструмент командной строки на Rust, который предоставляет агентам Claude Code команды структурной навигации, такие как 'покажи мне 180-токенное резюме этого 6000-токенного класса'. Бенчмаркинг на Sonnet 4.6 в 54 автоматизированных запусках показал снижение стоимости на 32% за задачу и на 67% больше правок кода за сессию.

24 мар. 2026 г., 11:45 UTC

OpenClawRadar

Инструменты

Prompt-Mini: Плагин Claude Code перехватывает нечеткие запросы, чтобы сократить потери кредитов.

Prompt-mini — это плагин Claude Code, который перехватывает расплывчатые промпты перед выполнением, задаёт уточняющие вопросы и создаёт структурированные промпты с определением стека технологий и конкретными правилами для 40+ фреймворков. Инструмент решает 35 проблемных паттернов, таких как отсутствие области действия, условий остановки и путей к файлам.

4 апр. 2026 г., 20:45 UTC

OpenClawRadar

Инструменты

LLMock: HTTP-сервер для мокинга, обеспечивающий детерминированное тестирование LLM между процессами

LLMock — это реальный HTTP-сервер, который мокает API OpenAI, Claude и Gemini, позволяя разработчикам запускать детерминированные тесты в нескольких процессах без обращения к реальным API. Он поддерживает SSE-стриминг, вызовы инструментов, предикатную маршрутизацию и журналирование запросов без зависимостей.

14 мар. 2026 г., 17:45 UTC

OpenClawRadar