Kvaser: Ein Open-Source, lokaler erster KI-Orchestrator mit Sub-Agent-Routing und Wolfram-Integration

Kvaser ist ein Open-Source-Orchestrierungsserver, der als Experiment mit Qwen 3.6 35B begann und sich zu einem vollwertigen Man-in-the-Middle-Proxy für lokale KI-Workflows entwickelte. Er sitzt zwischen Ihrem Frontend (wie Open WebUI) und Backend (llama.cpp) und stellt einen standardmäßigen OpenAI-Endpunkt bereit.
Wichtige technische Funktionen
- Zero-Embedding RAG: Fragt lokale Kiwix-Datensätze (Wikipedia, StackOverflow) direkt über einen MCP-Server ab und vermeidet so den Overhead von Vektordatenbanken.
- Wolfram-Engine-Integration: Ergänzt durch einen Mathematica-StackOverflow-Dump von Kiwix zur Verbesserung der Abfragestruktur für symbolische Mathematik.
- GEDCOM MCP: Ein benutzerdefiniertes Genealogie-Tool, das Stammbaumdaten mit Kiwix für historische Kontexte kombiniert.
- Unter-Agenten-Routing: Jeder Unter-Agent kann individuell konfiguriert und zu verschiedenen Maschinen oder Modellen geroutet werden.
- Intelligente Tool-Whitelist: Begrenzt, welche Tools jeder Unter-Agent sieht – ermöglicht es kleineren Modellen wie Qwen 3.5 4B, fokussiert zu bleiben, während das 35B-Modell komplexe Aufgaben übernimmt.
- Algorithmische Erweiterung: Implementiert algorithmische Tools für komplexe Aufgaben wie das Finden gemeinsamer Vorfahren oder das Berechnen von Verwandtschaftsbeziehungen, anstatt sich auf LLM-Inferenz zu verlassen.
Architektur
Das System bewegt sich von einem einzelnen Agenten zu einem vollständigen Orchestrierungsmodell mit Unter-Agenten. Dies löst Probleme wie "Tool-Bloat" und komplexe Baumdurchquerungen, die mit zunehmender Anzahl von Tools auftraten.
Anwendungsfall: Genealogie mit historischem Kontext
Durch die Kombination von GEDCOM-Stammbaumdaten mit Kiwix kann das Modell Ahnenaufzeichnungen mit historischem Kontext anreichern – ein eindrucksvolles Beispiel für lokale Orchestrierung.
Quellcode
Verfügbar auf GitHub: https://github.com/Na1w/kvaser-core
📖 Vollständige Quelle lesen: r/LocalLLaMA
👀 Siehe auch

MCP ermöglicht Claude die automatische Analyse von Google Search Console-Daten
Ein neuer kostenloser MCP verbindet Claude direkt mit der Google Search Console und ermöglicht Abfragen in natürlicher Sprache zu Suchleistungsdaten wie Suchbegriffe, Seiten, Klicks und CTR – ohne manuelle CSV-Exporte.

Aufbau eines Sprachassistenten mit unter 500 ms Latenz: Architektur und Leistungseinblicke
Ein Entwickler hat einen Sprachagenten von Grund auf neu gebaut und dabei eine End-to-End-Latenz von ~400 ms mit vollständigem STT → LLM → TTS-Streaming erreicht. Wichtige Erkenntnisse umfassen die Behandlung von Sprache als Problem der Sprechwechsel, die Verwendung semantischer Sprechwechselerkennung und die gemeinsame Platzierung aller Komponenten für minimale Latenz.

OpenClaw Einrichtungsunterstützung angeboten von ClawSet
ClawSet bietet Einrichtungsdienste für OpenClaw an, wobei der Fokus auf den Bedürfnissen der Kunden liegt. Der Service umfasst einen Einrichtungsgespräch für 99 $ und einen Monat Support bei der Fehlersuche.

AgenticStore MCP: Python-Toolkit für Claude Desktop mit 27 lokalen Tools
AgenticStore MCP ist ein Open-Source-Python-Toolkit, das mehrere MCP-Server durch eine einzige Installation ersetzt und Claude Desktop 27 lokale Tools bietet, darunter persistenter Speicher, Websuche und Repository-Überprüfung, ohne Docker- oder Node.js-Konfiguration zu erfordern.