Kvaser : Orchestrateur IA open-source avec routage de sous-agents

Kvaser est un serveur d'orchestration open-source qui a débuté comme une expérience avec Qwen 3.6 35B et a évolué en un proxy Man-in-the-Middle complet pour les workflows IA locaux. Il se place entre votre frontal (comme Open WebUI) et votre backend (llama.cpp), exposant un endpoint OpenAI standard.

Principales caractéristiques techniques

RAG sans plongement : Interroge directement les jeux de données Kiwix locaux (Wikipédia, StackOverflow) via un serveur MCP, évitant la surcharge des bases vectorielles.
Intégration Wolfram Engine : Enrichi avec un dump StackOverflow Mathematica provenant de Kiwix pour améliorer la structuration des requêtes en mathématiques symboliques.
GEDCOM MCP : Outil de généalogie personnalisé qui combine les données d'arbres généalogiques avec Kiwix pour un contexte historique.
Routage de sous-agents : Chaque sous-agent peut être configuré individuellement et routé vers différentes machines ou modèles.
Liste blanche intelligente d'outils : Limite les outils que chaque sous-agent voit — permet à des modèles plus petits comme Qwen 3.5 4B de rester concentrés tandis que le modèle 35B gère les tâches complexes.
Augmentation algorithmique : Implémente des outils algorithmiques pour des tâches complexes comme trouver des ancêtres communs ou calculer des relations, au lieu de se fier à l'inférence LLM.

Architecture

Le système dépasse l'agent unique pour adopter un modèle d'orchestration complet avec des sous-agents. Cela résout les problèmes de « gonflement des outils » et de parcours d'arbres complexes apparus avec l'ajout de nouveaux outils.

Cas d'usage : Généalogie avec contexte historique

En combinant les données d'arbres généalogiques GEDCOM avec Kiwix, le modèle peut enrichir les enregistrements d'ancêtres avec un contexte historique — un exemple puissant d'orchestration locale.

Code source

Disponible sur GitHub : https://github.com/Na1w/kvaser-core

📖 Lire la source complète : r/LocalLLaMA

Kvaser : Un orchestrateur IA open-source local-first avec routage de sous-agents et intégration Wolfram

Principales caractéristiques techniques

Architecture

Cas d'usage : Généalogie avec contexte historique

Code source

👀 See Also

Parlez avec Claw : Interface Vocale iOS Open Source pour les Bots OpenClaw Telegram

Xiaozhen : Une compétence de code Claude qui creuse trois couches pour identifier les causes profondes

Lumia : Système d'Assistance IA Local en Un Clic avec Mémoire Persistante

Compétence Tendr : Opérations CLI Déterministes pour la Gestion de la Mémoire des Agents