Kvaser: Orquestrador de IA Local-First com Roteamento de Subagentes

Kvaser é um servidor de orquestração de código aberto que começou como um experimento com Qwen 3.6 35B e evoluiu para um proxy Man-in-the-Middle completo para fluxos de trabalho de IA locais. Ele fica entre seu frontend (como Open WebUI) e backend (llama.cpp), expondo um endpoint OpenAI padrão.

Principais Características Técnicas

RAG sem Embeddings: Consulta datasets locais do Kiwix (Wikipedia, StackOverflow) diretamente via um servidor MCP, evitando a sobrecarga de banco de dados vetoriais.
Integração com Wolfram Engine: Aumentado com o dump do Mathematica StackOverflow do Kiwix para melhorar a estruturação de consultas para matemática simbólica.
GEDCOM MCP: Ferramenta de genealogia personalizada que combina dados de árvore genealógica com Kiwix para contexto histórico.
Roteamento de Subagentes: Cada subagente pode ser configurado individualmente e roteado para diferentes máquinas ou modelos.
Lista de Permissões Inteligente de Ferramentas: Limita quais ferramentas cada subagente vê — permite que modelos menores como Qwen 3.5 4B se mantenham focados enquanto o modelo 35B lida com tarefas complexas.
Aumento Algorítmico: Implementa ferramentas algorítmicas para tarefas complexas como encontrar ancestrais comuns ou calcular relacionamentos, em vez de depender de inferência de LLM.

Arquitetura

O sistema vai além de um único agente para um modelo de orquestração completo com subagentes. Isso resolve problemas de "inchaço de ferramentas" e travessia complexa de árvores que surgiram à medida que mais ferramentas foram adicionadas.

Caso de Uso: Genealogia com Contexto Histórico

Ao combinar dados de árvore genealógica GEDCOM com Kiwix, o modelo pode aumentar registros de ancestrais com contexto histórico — um exemplo poderoso de orquestração local-first.