Orkestra: Capa de Enrutamiento de LLM Consciente de Costos para OpenClaw Reduce los Costos de API en un 60-80%

Qué hace Orkestra
Orkestra es una capa de enrutamiento LLM consciente de los costos, creada para OpenClaw, que reduce los costos de API en un 60-80%. Es una arquitectura modular que se sitúa frente a las llamadas de modelo y decide qué nivel debe manejar cada solicitud según la similitud semántica.
Cómo funciona
Cuando llega una solicitud, se incrusta y pasa por un clasificador KNN ligero entrenado con cargas de trabajo previamente etiquetadas. Según la similitud semántica, el enrutador la categoriza como budget, balanced o premium y reenvía la llamada en consecuencia.
No hay reescritura de solicitudes ni árbol de reglas complejo, solo clasificación semántica en el momento de la llamada. La reducción en los costos de API proviene principalmente de evitar que las solicitudes más simples recurran por defecto a los modelos más costosos.
Integración con OpenClaw
Orkestra se conecta como una habilidad de OpenClaw a través de un proxy local, por lo que las canalizaciones existentes permanecen completamente intactas. El agente la llama mediante bash/curl a un endpoint compatible con OpenAI en 127.0.0.1:8765.
La respuesta incluye transparencia total de costos con los campos _orkestra.cost y _orkestra.savings_percent.
Proveedores admitidos y configuración
- Proveedores admitidos: Google (Gemini), Anthropic (Claude), OpenAI
- Enruta entre niveles económicos/equilibrados/premium dentro de cada proveedor
- Admite modo multi-proveedor en los tres proveedores
- Repositorio e integración con OpenClaw disponibles en: github.com/imperativelabs/orkestra
- Consulta
integrations/openclaw/para los archivos de habilidad, proxy y ejemplos de configuración
📖 Read the full source: r/openclaw
👀 Ver también

Manifest Ahora Admite Suscripciones a Claude Pro/Max Sin Clave de API
Manifest, una capa de enrutamiento de código abierto para OpenClaw, ahora permite la conexión directa de suscripciones Claude Pro o Max sin necesidad de una clave API. Los usuarios con claves API pueden configurar un enrutamiento de respaldo cuando se alcancen los límites de tasa de suscripción.

OpenPlawd: Habilidad de OpenClaw para Notas Automatizadas de Reuniones Plaud
OpenPlawd es una habilidad de OpenClaw que procesa automáticamente las grabaciones de Plaud y las convierte en notas de reunión estructuradas en HTML. Consulta las cuentas de Plaud cada hora, transcribe con Whisper o OpenAI, divide archivos grandes y genera notas con elementos de acción mediante un agente de OpenClaw.

Claude-Code v2.1.76 agrega elicitación MCP, optimizaciones de worktree y numerosas correcciones.
Claude-Code v2.1.76 introduce soporte de solicitud MCP para entrada estructurada durante tareas, agrega worktree.sparsePaths para eficiencia en monorepos, y corrige más de 20 problemas incluyendo pérdida de esquemas de herramientas diferidas, problemas con comandos de barra y estabilidad de sesiones de Control Remoto.

Ctxpact: Proxy de Compactación de Contexto para LLMs Locales
Ctxpact es un proxy compatible con OpenAI que comprime entradas de gran tamaño para LLMs locales con ventanas de contexto de 16k, utilizando una canalización de 3 etapas que incluye estrategias de DCP, resumen y extracción. Los benchmarks muestran 110k tokens comprimidos a 12k con una precisión de comprensión lectora de 8/8.