Kvaser: Un orquestador de IA local-first de código abierto con enrutamiento de subagentes e integración con Wolfram

Kvaser es un servidor de orquestación de código abierto que comenzó como un experimento con Qwen 3.6 35B y evolucionó hasta convertirse en un proxy intermediario completo para flujos de trabajo locales de IA. Se sitúa entre su frontend (como Open WebUI) y backend (llama.cpp), exponiendo un endpoint estándar de OpenAI.
Características Técnicas Clave
- RAG sin incrustaciones: Consulta conjuntos de datos locales de Kiwix (Wikipedia, StackOverflow) directamente a través de un servidor MCP, evitando la sobrecarga de bases de datos vectoriales.
- Integración con Wolfram Engine: Aumentado con el volcado de StackOverflow de Mathematica desde Kiwix para mejorar la estructuración de consultas de matemática simbólica.
- GEDCOM MCP: Herramienta de genealogía personalizada que combina datos de árboles genealógicos con Kiwix para contexto histórico.
- Enrutamiento de Subagentes: Cada subagente puede configurarse individualmente y enrutarse a diferentes máquinas o modelos.
- Lista Blanca Inteligente de Herramientas: Limita qué herramientas ve cada subagente — permite que modelos más pequeños como Qwen 3.5 4B se mantengan enfocados mientras el modelo de 35B maneja tareas complejas.
- Aumento Algorítmico: Implementa herramientas algorítmicas para tareas complejas como encontrar ancestros comunes o calcular relaciones, en lugar de depender de la inferencia del LLM.
Arquitectura
El sistema va más allá de un solo agente para adoptar un modelo de orquestación completo con subagentes. Esto resuelve la "inflación de herramientas" y los problemas de recorrido de árboles complejos que surgieron al agregar más herramientas.
Caso de Uso: Genealogía con Contexto Histórico
Al combinar datos de árboles genealógicos GEDCOM con Kiwix, el modelo puede aumentar los registros de ancestros con contexto histórico — un ejemplo poderoso de orquestación local.
Código Fuente
Disponible en GitHub: https://github.com/Na1w/kvaser-core
📖 Lea la fuente completa: r/LocalLLaMA
👀 Ver también

mencionado.to vs herramientas de monitoreo más amplias: una comparación de flujo de trabajo centrado en Reddit
mentioned.to es una herramienta de monitoreo diseñada específicamente para flujos de trabajo en Reddit, centrándose en el seguimiento de publicaciones relevantes, destacando oportunidades de respuesta, analizando contenido exitoso y redactando respuestas, en lugar de realizar un monitoreo amplio de marca en múltiples canales.

Agente de Trading con IA con Barreras de Riesgo para Inversión Educativa
Un desarrollador construyó un asistente de trading impulsado por IA que conecta Claude a una cuenta de corretaje con un motor de riesgo entre la IA y el dinero. El sistema incluye controles de seguridad como bloquear operaciones que excedan el 50% de la asignación de cartera, apagado automático al 3% de pérdida diaria y un interruptor de emergencia al 20% de reducción.

Ghostbar: Un cliente nativo de IA para macOS Swift de ~5MB que se oculta de la pantalla compartida
Ghostbar es un cliente de IA nativo de Swift para la barra de menús de macOS (~5MB) que usa window.sharingType = .none para volverse invisible para los grabadores de pantalla. Funciona con Ollama, vLLM, llama.cpp y cualquier backend compatible con OpenAI.

Cadena de respaldo de LLM multi-proveedor con soporte de Ollama en el IDE de IA de producción.
Resonant Genesis AI IDE integra soporte para LLM locales como proveedor de primera clase junto con Groq, OpenAI, Anthropic y Gemini a través de más de 30 microservicios utilizando una biblioteca compartida UnifiedLLMClient con cadena de respaldo automática.