Orkestra: Camada de Roteamento de LLM com Consciência de Custos para OpenClaw Reduz Custos de API em 60-80%

✍️ OpenClawRadar📅 Publicado: February 28, 2026🔗 Source
Orkestra: Camada de Roteamento de LLM com Consciência de Custos para OpenClaw Reduz Custos de API em 60-80%
Ad

O que o Orkestra faz

Orkestra é uma camada de roteamento de LLM consciente de custos desenvolvida para o OpenClaw que reduz os custos de API em 60-80%. É uma arquitetura modular que fica na frente das chamadas de modelo e decide qual nível deve lidar com cada solicitação com base na similaridade semântica.

Como funciona

Quando um prompt chega, ele é incorporado e passa por um classificador KNN leve treinado em cargas de trabalho previamente rotuladas. Com base na similaridade semântica, o roteador o categoriza como budget, balanced ou premium e encaminha a chamada de acordo.

Não há reescrita de prompt e nenhuma árvore de regras complexas — apenas classificação semântica no momento da chamada. A redução nos custos de API vem principalmente de evitar que prompts mais simples usem por padrão os modelos mais caros.

Ad

Integração com o OpenClaw

Orkestra se conecta como uma habilidade do OpenClaw por meio de um proxy local, para que os pipelines existentes permaneçam completamente intactos. O agente o chama via bash/curl para um endpoint compatível com OpenAI em 127.0.0.1:8765.

A resposta inclui transparência total de custos com os campos _orkestra.cost e _orkestra.savings_percent.

Provedores suportados e configuração

  • Provedores suportados: Google (Gemini), Anthropic (Claude), OpenAI
  • Roteia entre níveis econômico/equilibrado/premium dentro de cada provedor
  • Suporta modo multi-provedor entre todos os três provedores
  • Repositório e integração com OpenClaw disponíveis em: github.com/imperativelabs/orkestra
  • Veja integrations/openclaw/ para os arquivos de habilidade, proxy e exemplos de configuração

📖 Leia a fonte completa: r/openclaw

Ad

👀 See Also

Desbloqueando a Proatividade: Uma Análise Profunda das Inovações do Clawbot pela Comunidade
Tools

Desbloqueando a Proatividade: Uma Análise Profunda das Inovações do Clawbot pela Comunidade

Descubra como entusiastas estão aprimorando a proatividade de seus Clawbots por meio de estratégias inventivas e insights impulsionados pela comunidade. Um olhar sobre as discussões e revelações do r/openclaw.

OpenClawRadar
Servidor MCP de código aberto permite que agentes de IA processem pagamentos L402 via Lightning Network
Tools

Servidor MCP de código aberto permite que agentes de IA processem pagamentos L402 via Lightning Network

Um plugin MCP Python construído com FastMCP intercepta respostas HTTP 402 Pagamento Necessário, paga faturas da Lightning Network e recupera dados para agentes de IA. O repositório inclui um dummy-agent local para testes sem gastar fundos reais.

OpenClawRadar
BuddyBoard: Um Ranking Competitivo para o Recurso /buddy do Claude Code
Tools

BuddyBoard: Um Ranking Competitivo para o Recurso /buddy do Claude Code

BuddyBoard é uma ferramenta construída pela comunidade que cria um placar competitivo para o recurso /buddy do Claude Code, gerando cartas colecionáveis com estatísticas, níveis de raridade e um BuddyDex que rastreia 1.728 combinações possíveis. Execute com npx buddy-board para enviar seu buddy para o ranking global.

OpenClawRadar
Routerly: Gateway de LLM Auto-Hospedado com Políticas de Roteamento em Tempo Real e Controle de Orçamento
Tools

Routerly: Gateway de LLM Auto-Hospedado com Políticas de Roteamento em Tempo Real e Controle de Orçamento

Routerly é um gateway LLM gratuito, de código aberto e auto-hospedado que oferece seleção de modelos em tempo com base em políticas de roteamento como mais barato, mais rápido ou mais capaz, juntamente com limites de orçamento em nível de projeto com rastreamento por token. É compatível com OpenAI para uso direto com ferramentas como Cursor, LangChain e Open WebUI.

OpenClawRadar