Оркестра: Стоимостно-ориентированный слой маршрутизации LLM для OpenClaw сокращает затраты на API на 60-80%

✍️ OpenClawRadar📅 Опубликовано: 28 февраля 2026 г.🔗 Source
Оркестра: Стоимостно-ориентированный слой маршрутизации LLM для OpenClaw сокращает затраты на API на 60-80%
Ad

Что делает Orkestra

Orkestra — это экономически осознанный слой маршрутизации LLM, созданный для OpenClaw, который снижает затраты на API на 60–80%. Это модульная архитектура, которая располагается перед вызовами моделей и решает, какой уровень должен обрабатывать каждый запрос, на основе семантического сходства.

Как это работает

Когда поступает промпт, он преобразуется в эмбеддинг и проходит через легковесный классификатор KNN, обученный на ранее размеченных рабочих нагрузках. На основе семантического сходства маршрутизатор классифицирует его как budget, balanced или premium и соответствующим образом перенаправляет вызов.

Нет переписывания промптов и нет сложного дерева правил — только семантическая классификация в момент вызова. Снижение затрат на API происходит в основном за счёт предотвращения автоматического направления простых промптов к самым дорогим моделям.

Ad

Интеграция с OpenClaw

Orkestra подключается как навык OpenClaw через локальный прокси, поэтому существующие конвейеры остаются полностью нетронутыми. Агент вызывает его через bash/curl на OpenAI-совместимый эндпоинт по адресу 127.0.0.1:8765.

Ответ включает полную прозрачность затрат с полями _orkestra.cost и _orkestra.savings_percent.

Поддерживаемые провайдеры и конфигурация

  • Поддерживаемые провайдеры: Google (Gemini), Anthropic (Claude), OpenAI
  • Маршрутизация между бюджетным/сбалансированным/премиум-уровнями внутри каждого провайдера
  • Поддерживает мультипровайдерный режим для всех трёх провайдеров
  • Репозиторий и интеграция с OpenClaw доступны по адресу: github.com/imperativelabs/orkestra
  • См. integrations/openclaw/ для файлов навыка, прокси и примеров конфигурации

📖 Read the full source: r/openclaw

Ad

👀 Смотрите также

Разработчик создаёт библиотеку сжатия на Rust с помощью Claude Opus 4.6, задаваясь вопросом о её практической пользе.
Инструменты

Разработчик создаёт библиотеку сжатия на Rust с помощью Claude Opus 4.6, задаваясь вопросом о её практической пользе.

Разработчик использовал Claude Opus 4.6 в течение двух недель для создания библиотеки сжатия на Rust объёмом 15 800 строк с 449 пройденными тестами, привязками для Python и слоем C FFI, но задаётся вопросом, нужна ли была ещё одна библиотека сжатия.

OpenClawRadar
Антигравитация 2.0 возглавляет архитектурный 3D-бенчмарк OpenSCAD – ModelRift тестирует 6 LLM на Пантеоне
Инструменты

Антигравитация 2.0 возглавляет архитектурный 3D-бенчмарк OpenSCAD – ModelRift тестирует 6 LLM на Пантеоне

ModelRift сравнил 6 ИИ-инструментов при создании Пантеона в OpenSCAD. Antigravity набрал 4.5/5 за архитектурное качество, обогнав базовый Codex 5.5. Cursor 3.5 оказался самым быстрым, но худшим по качеству.

OpenClawRadar
Обзор производительности Omnicoder-9B: Скорость против проблем с вызовом инструментов
Инструменты

Обзор производительности Omnicoder-9B: Скорость против проблем с вызовом инструментов

Omnicoder-9B, модель, ориентированная на программирование, дообученная на Qwen3.5 9B с выводами от Opus 4.6, GPT 5.4, GPT 5.3 Codex и Gemini 3.1 Pro, демонстрирует высокую производительность на оборудовании среднего уровня, но имеет проблемы с вызовом инструментов в IDE.

OpenClawRadar
Открытый SDK для AI-работы с знаниями
Инструменты

Открытый SDK для AI-работы с знаниями

ClioAI выпустил <strong>kw-sdk</strong>, открытый набор инструментов для разработки программного обеспечения, предназначенный для структурирования работы ИИ-агентов в областях знаний, таких как исследование, анализ, стратегия и написание текстов. В отличие от традиционных кодовых фреймворков, которые имеют естественные сигналы верификации через тестирование, работа с знаниями требует структурированных подходов для проверки и оценки задач.

OpenClawRadar