Orkestra: Capa de Enrutamiento de LLM Consciente de Costos para OpenClaw Reduce los Costos de API en un 60-80%

✍️ OpenClawRadar📅 Publicado: 28 de febrero de 2026🔗 Source
Orkestra: Capa de Enrutamiento de LLM Consciente de Costos para OpenClaw Reduce los Costos de API en un 60-80%
Ad

Qué hace Orkestra

Orkestra es una capa de enrutamiento LLM consciente de los costos, creada para OpenClaw, que reduce los costos de API en un 60-80%. Es una arquitectura modular que se sitúa frente a las llamadas de modelo y decide qué nivel debe manejar cada solicitud según la similitud semántica.

Cómo funciona

Cuando llega una solicitud, se incrusta y pasa por un clasificador KNN ligero entrenado con cargas de trabajo previamente etiquetadas. Según la similitud semántica, el enrutador la categoriza como budget, balanced o premium y reenvía la llamada en consecuencia.

No hay reescritura de solicitudes ni árbol de reglas complejo, solo clasificación semántica en el momento de la llamada. La reducción en los costos de API proviene principalmente de evitar que las solicitudes más simples recurran por defecto a los modelos más costosos.

Ad

Integración con OpenClaw

Orkestra se conecta como una habilidad de OpenClaw a través de un proxy local, por lo que las canalizaciones existentes permanecen completamente intactas. El agente la llama mediante bash/curl a un endpoint compatible con OpenAI en 127.0.0.1:8765.

La respuesta incluye transparencia total de costos con los campos _orkestra.cost y _orkestra.savings_percent.

Proveedores admitidos y configuración

  • Proveedores admitidos: Google (Gemini), Anthropic (Claude), OpenAI
  • Enruta entre niveles económicos/equilibrados/premium dentro de cada proveedor
  • Admite modo multi-proveedor en los tres proveedores
  • Repositorio e integración con OpenClaw disponibles en: github.com/imperativelabs/orkestra
  • Consulta integrations/openclaw/ para los archivos de habilidad, proxy y ejemplos de configuración

📖 Read the full source: r/openclaw

Ad

👀 Ver también

Manifest Ahora Admite Suscripciones a Claude Pro/Max Sin Clave de API
Herramientas

Manifest Ahora Admite Suscripciones a Claude Pro/Max Sin Clave de API

Manifest, una capa de enrutamiento de código abierto para OpenClaw, ahora permite la conexión directa de suscripciones Claude Pro o Max sin necesidad de una clave API. Los usuarios con claves API pueden configurar un enrutamiento de respaldo cuando se alcancen los límites de tasa de suscripción.

OpenClawRadar
OpenPlawd: Habilidad de OpenClaw para Notas Automatizadas de Reuniones Plaud
Herramientas

OpenPlawd: Habilidad de OpenClaw para Notas Automatizadas de Reuniones Plaud

OpenPlawd es una habilidad de OpenClaw que procesa automáticamente las grabaciones de Plaud y las convierte en notas de reunión estructuradas en HTML. Consulta las cuentas de Plaud cada hora, transcribe con Whisper o OpenAI, divide archivos grandes y genera notas con elementos de acción mediante un agente de OpenClaw.

OpenClawRadar
Claude-Code v2.1.76 agrega elicitación MCP, optimizaciones de worktree y numerosas correcciones.
Herramientas

Claude-Code v2.1.76 agrega elicitación MCP, optimizaciones de worktree y numerosas correcciones.

Claude-Code v2.1.76 introduce soporte de solicitud MCP para entrada estructurada durante tareas, agrega worktree.sparsePaths para eficiencia en monorepos, y corrige más de 20 problemas incluyendo pérdida de esquemas de herramientas diferidas, problemas con comandos de barra y estabilidad de sesiones de Control Remoto.

OpenClawRadar
Ctxpact: Proxy de Compactación de Contexto para LLMs Locales
Herramientas

Ctxpact: Proxy de Compactación de Contexto para LLMs Locales

Ctxpact es un proxy compatible con OpenAI que comprime entradas de gran tamaño para LLMs locales con ventanas de contexto de 16k, utilizando una canalización de 3 etapas que incluye estrategias de DCP, resumen y extracción. Los benchmarks muestran 110k tokens comprimidos a 12k con una precisión de comprensión lectora de 8/8.

OpenClawRadar