Оркестра: Стоимостно-ориентированный слой маршрутизации LLM для OpenClaw сокращает затраты на API на 60-80%

Что делает Orkestra
Orkestra — это экономически осознанный слой маршрутизации LLM, созданный для OpenClaw, который снижает затраты на API на 60–80%. Это модульная архитектура, которая располагается перед вызовами моделей и решает, какой уровень должен обрабатывать каждый запрос, на основе семантического сходства.
Как это работает
Когда поступает промпт, он преобразуется в эмбеддинг и проходит через легковесный классификатор KNN, обученный на ранее размеченных рабочих нагрузках. На основе семантического сходства маршрутизатор классифицирует его как budget, balanced или premium и соответствующим образом перенаправляет вызов.
Нет переписывания промптов и нет сложного дерева правил — только семантическая классификация в момент вызова. Снижение затрат на API происходит в основном за счёт предотвращения автоматического направления простых промптов к самым дорогим моделям.
Интеграция с OpenClaw
Orkestra подключается как навык OpenClaw через локальный прокси, поэтому существующие конвейеры остаются полностью нетронутыми. Агент вызывает его через bash/curl на OpenAI-совместимый эндпоинт по адресу 127.0.0.1:8765.
Ответ включает полную прозрачность затрат с полями _orkestra.cost и _orkestra.savings_percent.
Поддерживаемые провайдеры и конфигурация
- Поддерживаемые провайдеры: Google (Gemini), Anthropic (Claude), OpenAI
- Маршрутизация между бюджетным/сбалансированным/премиум-уровнями внутри каждого провайдера
- Поддерживает мультипровайдерный режим для всех трёх провайдеров
- Репозиторий и интеграция с OpenClaw доступны по адресу: github.com/imperativelabs/orkestra
- См.
integrations/openclaw/для файлов навыка, прокси и примеров конфигурации
📖 Read the full source: r/openclaw
👀 Смотрите также

Разработчик создаёт библиотеку сжатия на Rust с помощью Claude Opus 4.6, задаваясь вопросом о её практической пользе.
Разработчик использовал Claude Opus 4.6 в течение двух недель для создания библиотеки сжатия на Rust объёмом 15 800 строк с 449 пройденными тестами, привязками для Python и слоем C FFI, но задаётся вопросом, нужна ли была ещё одна библиотека сжатия.

Антигравитация 2.0 возглавляет архитектурный 3D-бенчмарк OpenSCAD – ModelRift тестирует 6 LLM на Пантеоне
ModelRift сравнил 6 ИИ-инструментов при создании Пантеона в OpenSCAD. Antigravity набрал 4.5/5 за архитектурное качество, обогнав базовый Codex 5.5. Cursor 3.5 оказался самым быстрым, но худшим по качеству.

Обзор производительности Omnicoder-9B: Скорость против проблем с вызовом инструментов
Omnicoder-9B, модель, ориентированная на программирование, дообученная на Qwen3.5 9B с выводами от Opus 4.6, GPT 5.4, GPT 5.3 Codex и Gemini 3.1 Pro, демонстрирует высокую производительность на оборудовании среднего уровня, но имеет проблемы с вызовом инструментов в IDE.

Открытый SDK для AI-работы с знаниями
ClioAI выпустил <strong>kw-sdk</strong>, открытый набор инструментов для разработки программного обеспечения, предназначенный для структурирования работы ИИ-агентов в областях знаний, таких как исследование, анализ, стратегия и написание текстов. В отличие от традиционных кодовых фреймворков, которые имеют естественные сигналы верификации через тестирование, работа с знаниями требует структурированных подходов для проверки и оценки задач.