Прокси с открытым исходным кодом RelayPlane демонстрирует снижение затрат на 73% благодаря маршрутизации моделей Claude.

Открытый прокси для маршрутизации API Claude
RelayPlane — это открытый npm-нативный прокси, который располагается перед API Anthropic. Инструмент был создан с использованием Claude Code, что ускорило разработку. Его можно бесплатно разместить самостоятельно, и он предназначен для обработки маршрутизации между различными моделями Claude в зависимости от сложности запроса.
Результаты тестирования и конфигурация
В тестах использовалась смешанная нагрузка: 60% простых задач и 40% сложных задач. Были сравнены два сценария:
- Прямой доступ (только Sonnet): p50 задержка 1,55 с, стоимость 10 запросов $0,0323
- Через RelayPlane с маршрутизацией: p50 задержка 0,78 с, стоимость 10 запросов $0,0086
Это означает снижение затрат на 73,4%. При 10 000 запросов в день это соответствует примерно $712 ежемесячной экономии.
Конфигурация маршрутизации
Конфигурация маршрутизации проста:
{
"routing": {
"complexity": {
"enabled": true,
"simple": "claude-haiku-4-5",
"moderate": "claude-sonnet-4-6",
"complex": "claude-opus-4-6"
}
}
}Логика маршрутизации использует классификатор сложности, который анализирует количество токенов, индикаторы кода и аналитические ключевые слова. Заголовки ответов включают x-relayplane-routed-model для проверки того, какая модель фактически обработала запрос.
Цены моделей и логика маршрутизации
Система маршрутизации направляет запросы к соответствующим моделям в зависимости от сложности:
- Простые запросы → Haiku ($0,80 за миллион токенов)
- Средние запросы → Sonnet ($3 за миллион токенов)
- Сложные запросы → Opus ($15 за миллион токенов)
Автор отмечает, что классификатор не идеален, но «достаточно хорош, чтобы обеспечить большую часть экономии». Полная методология тестирования доступна в Gist, ссылка на который приведена в исходном материале.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Оверлей на рабочем столе в реальном времени для мониторинга лимитов использования кода Claude
Новый инструмент с открытым исходным кодом позволяет разработчикам в реальном времени отслеживать лимиты использования Claude Code с помощью настольного оверлея, избавляя от необходимости многократно вводить '/usage'.

Visdiff: Визуальная петля обратной связи для генерации фронтенд-кода Claude
Visdiff решает проблему визуальной точности в генерации фронтенд-кода Claude, сравнивая отрендеренный результат пиксель за пикселем с дизайнами Figma и передавая различия обратно в цикл до полного совпадения.
Claude Code против Codex: 36 против 28 файлов, $2.50 против $2.04, обнаружен бесконечный цикл — сравнение в реальных условиях
Разработчик запускает одни и те же две задачи на Claude Code и Codex (Cursor): бот для триажа PR и интерфейс ревью кода в реальном времени. Результаты: 36 против 28 файлов, $2.50 против $2.04, Claude допустил меньше ошибок TypeScript, Codex зациклился в React.

Публично доступные MCP-серверы для данных в области здравоохранения, науки и государственного управления
Разработчик создал и публично разместил 14 MCP-серверов, предоставляющих доступ к наборам данных CDC, клиническим испытаниям, данным FDA, академическим публикациям, информации о Конгрессе, погодным данным и другим утилитам. Эти серверы не требуют настройки, API-ключей или локальной установки.