Orkestra: снижает затраты на API LLM на 60-80%

Что делает Orkestra

Orkestra — это экономически осознанный слой маршрутизации LLM, созданный для OpenClaw, который снижает затраты на API на 60–80%. Это модульная архитектура, которая располагается перед вызовами моделей и решает, какой уровень должен обрабатывать каждый запрос, на основе семантического сходства.

Как это работает

Когда поступает промпт, он преобразуется в эмбеддинг и проходит через легковесный классификатор KNN, обученный на ранее размеченных рабочих нагрузках. На основе семантического сходства маршрутизатор классифицирует его как budget, balanced или premium и соответствующим образом перенаправляет вызов.

Нет переписывания промптов и нет сложного дерева правил — только семантическая классификация в момент вызова. Снижение затрат на API происходит в основном за счёт предотвращения автоматического направления простых промптов к самым дорогим моделям.

Интеграция с OpenClaw

Orkestra подключается как навык OpenClaw через локальный прокси, поэтому существующие конвейеры остаются полностью нетронутыми. Агент вызывает его через bash/curl на OpenAI-совместимый эндпоинт по адресу 127.0.0.1:8765.

Ответ включает полную прозрачность затрат с полями _orkestra.cost и _orkestra.savings_percent.

Поддерживаемые провайдеры и конфигурация

Поддерживаемые провайдеры: Google (Gemini), Anthropic (Claude), OpenAI
Маршрутизация между бюджетным/сбалансированным/премиум-уровнями внутри каждого провайдера
Поддерживает мультипровайдерный режим для всех трёх провайдеров
Репозиторий и интеграция с OpenClaw доступны по адресу: github.com/imperativelabs/orkestra
См. integrations/openclaw/ для файлов навыка, прокси и примеров конфигурации

📖 Read the full source: r/openclaw

Оркестра: Стоимостно-ориентированный слой маршрутизации LLM для OpenClaw сокращает затраты на API на 60-80%

Что делает Orkestra

Как это работает

Интеграция с OpenClaw

Поддерживаемые провайдеры и конфигурация

👀 Смотрите также

Солитер: Открытый Идентификационный Слой для ИИ-Агентов, Созданный с Кодом Claude

CipherClaw: Использование защитной персоны для аудита кода с помощью Claude

Обзор альтернатив Hermes Agent 2026: Самостоятельно размещаемые решения от OpenClaw до memU Bot

Бенчмарк OpenClaw демонстрирует, что Qwen3.5:27B превосходит другие локальные LLM в задачах агентов.