Kvaser: Um Orquestrador de IA Local-First de Código Aberto com Roteamento de Subagentes e Integração Wolfram

Kvaser é um servidor de orquestração de código aberto que começou como um experimento com Qwen 3.6 35B e evoluiu para um proxy Man-in-the-Middle completo para fluxos de trabalho de IA locais. Ele fica entre seu frontend (como Open WebUI) e backend (llama.cpp), expondo um endpoint OpenAI padrão.
Principais Características Técnicas
- RAG sem Embeddings: Consulta datasets locais do Kiwix (Wikipedia, StackOverflow) diretamente via um servidor MCP, evitando a sobrecarga de banco de dados vetoriais.
- Integração com Wolfram Engine: Aumentado com o dump do Mathematica StackOverflow do Kiwix para melhorar a estruturação de consultas para matemática simbólica.
- GEDCOM MCP: Ferramenta de genealogia personalizada que combina dados de árvore genealógica com Kiwix para contexto histórico.
- Roteamento de Subagentes: Cada subagente pode ser configurado individualmente e roteado para diferentes máquinas ou modelos.
- Lista de Permissões Inteligente de Ferramentas: Limita quais ferramentas cada subagente vê — permite que modelos menores como Qwen 3.5 4B se mantenham focados enquanto o modelo 35B lida com tarefas complexas.
- Aumento Algorítmico: Implementa ferramentas algorítmicas para tarefas complexas como encontrar ancestrais comuns ou calcular relacionamentos, em vez de depender de inferência de LLM.
Arquitetura
O sistema vai além de um único agente para um modelo de orquestração completo com subagentes. Isso resolve problemas de "inchaço de ferramentas" e travessia complexa de árvores que surgiram à medida que mais ferramentas foram adicionadas.
Caso de Uso: Genealogia com Contexto Histórico
Ao combinar dados de árvore genealógica GEDCOM com Kiwix, o modelo pode aumentar registros de ancestrais com contexto histórico — um exemplo poderoso de orquestração local-first.
Código Fonte
Disponível no GitHub: https://github.com/Na1w/kvaser-core
📖 Leia a fonte completa: r/LocalLLaMA
👀 See Also

Habilidade de teste SwiftUI de código aberto para Claude Code usa Computer Use para testar aplicativos visualmente
Uma habilidade de código Claude de código aberto chamada /ios-test testa visualmente aplicativos SwiftUI usando a capacidade de Uso do Computador. O agente encontra arquivos .xcodeproj, constrói o aplicativo em um Simulador e, em seguida, navega por todas as telas, tocando em botões e seguindo links como um usuário real.

Plugins do Claude: Visão Computacional, Conselho de Multiagentes e Fluxo de Autocorreção
Três plugins do Claude foram lançados: Computer Vision v1.7.0 para automação de aplicativos Windows, The Council v3.1.0 para consulta multiagente adversária e Upwork Scraper v0.2.0 para análise do mercado de trabalho. Uma demonstração mostrou o Claude usando esses plugins para diagnosticar e corrigir seu próprio bug de automação do Solitaire.

Análise dos Componentes Reutilizáveis em Go do Ollama para Desenvolvimento Local de LLM
Um desenvolvedor examinou o código-fonte do Ollama e encontrou vários componentes independentes em Go, incluindo um amostrador de tokens puro em Go, leitor/gravador GGUF, ferramentas de conversão de modelos, renderização de templates de chat e transformações de compatibilidade com OpenAI que não estão disponíveis como bibliotecas separadas.

Solução Alternativa para a Lacuna de Migração de Projetos do ChatGPT: Exportar Scripts e Prompts
Um desenvolvedor criou scripts em Python e prompts do Claude para migrar conversas do ChatGPT para o Claude quando a exportação de dados do ChatGPT não inclui informações de associação a projetos. A solução extrai conversas usando títulos capturados da interface.