Прокси с открытым исходным кодом RelayPlane демонстрирует снижение затрат на 73% благодаря маршрутизации моделей Claude.

✍️ OpenClawRadar📅 Опубликовано: 7 апреля 2026 г.🔗 Source
Прокси с открытым исходным кодом RelayPlane демонстрирует снижение затрат на 73% благодаря маршрутизации моделей Claude.
Ad

Открытый прокси для маршрутизации API Claude

RelayPlane — это открытый npm-нативный прокси, который располагается перед API Anthropic. Инструмент был создан с использованием Claude Code, что ускорило разработку. Его можно бесплатно разместить самостоятельно, и он предназначен для обработки маршрутизации между различными моделями Claude в зависимости от сложности запроса.

Результаты тестирования и конфигурация

В тестах использовалась смешанная нагрузка: 60% простых задач и 40% сложных задач. Были сравнены два сценария:

  • Прямой доступ (только Sonnet): p50 задержка 1,55 с, стоимость 10 запросов $0,0323
  • Через RelayPlane с маршрутизацией: p50 задержка 0,78 с, стоимость 10 запросов $0,0086

Это означает снижение затрат на 73,4%. При 10 000 запросов в день это соответствует примерно $712 ежемесячной экономии.

Ad

Конфигурация маршрутизации

Конфигурация маршрутизации проста:

{
  "routing": {
    "complexity": {
      "enabled": true,
      "simple": "claude-haiku-4-5",
      "moderate": "claude-sonnet-4-6",
      "complex": "claude-opus-4-6"
    }
  }
}

Логика маршрутизации использует классификатор сложности, который анализирует количество токенов, индикаторы кода и аналитические ключевые слова. Заголовки ответов включают x-relayplane-routed-model для проверки того, какая модель фактически обработала запрос.

Цены моделей и логика маршрутизации

Система маршрутизации направляет запросы к соответствующим моделям в зависимости от сложности:

  • Простые запросы → Haiku ($0,80 за миллион токенов)
  • Средние запросы → Sonnet ($3 за миллион токенов)
  • Сложные запросы → Opus ($15 за миллион токенов)

Автор отмечает, что классификатор не идеален, но «достаточно хорош, чтобы обеспечить большую часть экономии». Полная методология тестирования доступна в Gist, ссылка на который приведена в исходном материале.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Оверлей на рабочем столе в реальном времени для мониторинга лимитов использования кода Claude
Инструменты

Оверлей на рабочем столе в реальном времени для мониторинга лимитов использования кода Claude

Новый инструмент с открытым исходным кодом позволяет разработчикам в реальном времени отслеживать лимиты использования Claude Code с помощью настольного оверлея, избавляя от необходимости многократно вводить '/usage'.

OpenClawRadar
Visdiff: Визуальная петля обратной связи для генерации фронтенд-кода Claude
Инструменты

Visdiff: Визуальная петля обратной связи для генерации фронтенд-кода Claude

Visdiff решает проблему визуальной точности в генерации фронтенд-кода Claude, сравнивая отрендеренный результат пиксель за пикселем с дизайнами Figma и передавая различия обратно в цикл до полного совпадения.

OpenClawRadar
🦀
Инструменты

Claude Code против Codex: 36 против 28 файлов, $2.50 против $2.04, обнаружен бесконечный цикл — сравнение в реальных условиях

Разработчик запускает одни и те же две задачи на Claude Code и Codex (Cursor): бот для триажа PR и интерфейс ревью кода в реальном времени. Результаты: 36 против 28 файлов, $2.50 против $2.04, Claude допустил меньше ошибок TypeScript, Codex зациклился в React.

OpenClawRadar
Публично доступные MCP-серверы для данных в области здравоохранения, науки и государственного управления
Инструменты

Публично доступные MCP-серверы для данных в области здравоохранения, науки и государственного управления

Разработчик создал и публично разместил 14 MCP-серверов, предоставляющих доступ к наборам данных CDC, клиническим испытаниям, данным FDA, академическим публикациям, информации о Конгрессе, погодным данным и другим утилитам. Эти серверы не требуют настройки, API-ключей или локальной установки.

OpenClawRadar