llmLibrarian: Lokale RAG-Engine mit MCP-Integration für dateibasierte KI-Suche

✍️ OpenClawRadar📅 Veröffentlicht: 30. März 2026🔗 Source
llmLibrarian: Lokale RAG-Engine mit MCP-Integration für dateibasierte KI-Suche
Ad

Was das ist

llmLibrarian ist eine lokale RAG-Engine (Retrieval-Augmented Generation), die Abruffähigkeiten über das Model Context Protocol (MCP) verfügbar macht. Sie ermöglicht es Ihnen, Ordner in Silos (ChromaDB-Sammlungen) zu indizieren und diese dann von jedem MCP-Client – einschließlich Claude – abzufragen, um fundierte, zitierte Antworten zu erhalten.

Wichtige Funktionen und Architektur

Das Tool indiziert Ordner in Silos, bei denen es sich um ChromaDB-Sammlungen handelt. Wenn Sie direkte Antworten anstelle von Rohdatenblöcken wünschen, übernimmt Ollama die Syntheseschicht. Alles läuft lokal auf Ihrem Computer.

Der Entwickler hebt die Multi-Silo-Fähigkeit als besonders leistungsstark hervor: Die Kombination von Silos ermöglicht es, Muster über Domänen hinweg sichtbar zu machen, die manuell schwer zu erkennen wären. Beispielsweise wird ein Journal-Ordner zu einem Denkpartner, der sich merkt, was Sie geschrieben haben, und eine Codebasis wird zu einem Agenten, der Ihre tatsächlichen Dateien kennt.

Ad

Verfügbare MCP-Tools

  • retrieve – hybride RRF-Vektorsuche, die Rohdatenblöcke mit Konfidenzwerten zurückgibt, über die Claude nachdenken kann
  • retrieve_bulk – Multi-Angle-Abfragen in einem Aufruf, nützlich beim Aggregieren über Dokumenttypen hinweg
  • ask – von Ollama synthetisierte Antwort direkt aus dem abgerufenen Kontext (standardmäßig llama3.1:8b, aber Sie können jedes Modell verwenden, das Sie heruntergeladen haben)
  • list_silos, inspect_silo, trigger_reindex – Tools zur Indexverwaltung

Technischer Stack

  • ChromaDB für Vektorspeicherung
  • Ollama für Modellsynthese
  • sentence-transformers (all-mpnet-base-v2, MPS-beschleunigt) für Embeddings
  • fastmcp für die MCP-Schicht

Der Entwickler erwähnt, dass das Multi-Silo-Metadaten-Tagging in ChromaDB mehrere Iterationen benötigte, um richtig zu funktionieren, und ist offen für Diskussionen über die Architektur.

Diese Art von Tool ist nützlich für Entwickler, die KI-Agenten erstellen möchten, die auf ihre lokalen Dateien verweisen und darüber nachdenken können, ohne Daten an externe Dienste zu senden.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

Aufbau eines agentischen RAG für Obsidian mit Claude und einer Evaluierungsumgebung zur Erkennung von Halluzinationen
Werkzeuge

Aufbau eines agentischen RAG für Obsidian mit Claude und einer Evaluierungsumgebung zur Erkennung von Halluzinationen

Ein Entwickler baute ein agentisches RAG-System über einem Obsidian-Vault, damit Claude Fragen aus Ingenieurbüchern beantworten kann, und erstellte dann ein Evaluierungs-Tool mit Claude Sonnet als Richter, um zu erkennen, wann der Agent zuversichtlich falsch lag. Rubrik-Iterationen verbesserten die Übereinstimmung zwischen Richter und Mensch von 39 % auf 94 %.

OpenClawRadar
Ollama-Update fügt OpenClaw-Unterstützung für das Kimi k2.5-Cloud-Modell hinzu
Werkzeuge

Ollama-Update fügt OpenClaw-Unterstützung für das Kimi k2.5-Cloud-Modell hinzu

Ollama hat ein Update veröffentlicht, das OpenClaw-Unterstützung für Cloud-Modelle integriert, einschließlich kostenfreiem Zugang zum Kimi k2.5-Modell mit Websuchfunktion, das in NVIDIA-Rechenzentren läuft.

OpenClawRadar
VSCode-Perplexity-MCP: Nutzen Sie Ihr Perplexity-Konto für kostenlose KI-Suche in VS Code
Werkzeuge

VSCode-Perplexity-MCP: Nutzen Sie Ihr Perplexity-Konto für kostenlose KI-Suche in VS Code

Ein Open-Source-MCP-Server, der es ermöglicht, Ihr Perplexity.ai-Konto mit VS Code zu verbinden und Clawbot Such-, Reasoning- und Compute-Funktionen bereitzustellen, ohne pro API-Anfrage zu bezahlen.

OpenClawRadar
OpenClaw PARA-Organisationsfähigkeit sortiert Dateien automatisch in Projekte, Bereiche, Ressourcen und Archive
Werkzeuge

OpenClaw PARA-Organisationsfähigkeit sortiert Dateien automatisch in Projekte, Bereiche, Ressourcen und Archive

Ein Entwickler hat eine OpenClaw-Fähigkeit erstellt, die die PARA-Methode (Projekte, Bereiche, Ressourcen, Archive) zur Dateiorganisation durchsetzt und Inhalte automatisch sortiert, anstatt alles im Hauptverzeichnis abzulegen.

OpenClawRadar