llmLibrarian: Lokale RAG-Engine mit MCP-Integration für dateibasierte KI-Suche

Was das ist
llmLibrarian ist eine lokale RAG-Engine (Retrieval-Augmented Generation), die Abruffähigkeiten über das Model Context Protocol (MCP) verfügbar macht. Sie ermöglicht es Ihnen, Ordner in Silos (ChromaDB-Sammlungen) zu indizieren und diese dann von jedem MCP-Client – einschließlich Claude – abzufragen, um fundierte, zitierte Antworten zu erhalten.
Wichtige Funktionen und Architektur
Das Tool indiziert Ordner in Silos, bei denen es sich um ChromaDB-Sammlungen handelt. Wenn Sie direkte Antworten anstelle von Rohdatenblöcken wünschen, übernimmt Ollama die Syntheseschicht. Alles läuft lokal auf Ihrem Computer.
Der Entwickler hebt die Multi-Silo-Fähigkeit als besonders leistungsstark hervor: Die Kombination von Silos ermöglicht es, Muster über Domänen hinweg sichtbar zu machen, die manuell schwer zu erkennen wären. Beispielsweise wird ein Journal-Ordner zu einem Denkpartner, der sich merkt, was Sie geschrieben haben, und eine Codebasis wird zu einem Agenten, der Ihre tatsächlichen Dateien kennt.
Verfügbare MCP-Tools
retrieve– hybride RRF-Vektorsuche, die Rohdatenblöcke mit Konfidenzwerten zurückgibt, über die Claude nachdenken kannretrieve_bulk– Multi-Angle-Abfragen in einem Aufruf, nützlich beim Aggregieren über Dokumenttypen hinwegask– von Ollama synthetisierte Antwort direkt aus dem abgerufenen Kontext (standardmäßig llama3.1:8b, aber Sie können jedes Modell verwenden, das Sie heruntergeladen haben)list_silos,inspect_silo,trigger_reindex– Tools zur Indexverwaltung
Technischer Stack
- ChromaDB für Vektorspeicherung
- Ollama für Modellsynthese
- sentence-transformers (all-mpnet-base-v2, MPS-beschleunigt) für Embeddings
- fastmcp für die MCP-Schicht
Der Entwickler erwähnt, dass das Multi-Silo-Metadaten-Tagging in ChromaDB mehrere Iterationen benötigte, um richtig zu funktionieren, und ist offen für Diskussionen über die Architektur.
Diese Art von Tool ist nützlich für Entwickler, die KI-Agenten erstellen möchten, die auf ihre lokalen Dateien verweisen und darüber nachdenken können, ohne Daten an externe Dienste zu senden.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Aufbau eines agentischen RAG für Obsidian mit Claude und einer Evaluierungsumgebung zur Erkennung von Halluzinationen
Ein Entwickler baute ein agentisches RAG-System über einem Obsidian-Vault, damit Claude Fragen aus Ingenieurbüchern beantworten kann, und erstellte dann ein Evaluierungs-Tool mit Claude Sonnet als Richter, um zu erkennen, wann der Agent zuversichtlich falsch lag. Rubrik-Iterationen verbesserten die Übereinstimmung zwischen Richter und Mensch von 39 % auf 94 %.

Ollama-Update fügt OpenClaw-Unterstützung für das Kimi k2.5-Cloud-Modell hinzu
Ollama hat ein Update veröffentlicht, das OpenClaw-Unterstützung für Cloud-Modelle integriert, einschließlich kostenfreiem Zugang zum Kimi k2.5-Modell mit Websuchfunktion, das in NVIDIA-Rechenzentren läuft.

VSCode-Perplexity-MCP: Nutzen Sie Ihr Perplexity-Konto für kostenlose KI-Suche in VS Code
Ein Open-Source-MCP-Server, der es ermöglicht, Ihr Perplexity.ai-Konto mit VS Code zu verbinden und Clawbot Such-, Reasoning- und Compute-Funktionen bereitzustellen, ohne pro API-Anfrage zu bezahlen.

OpenClaw PARA-Organisationsfähigkeit sortiert Dateien automatisch in Projekte, Bereiche, Ressourcen und Archive
Ein Entwickler hat eine OpenClaw-Fähigkeit erstellt, die die PARA-Methode (Projekte, Bereiche, Ressourcen, Archive) zur Dateiorganisation durchsetzt und Inhalte automatisch sortiert, anstatt alles im Hauptverzeichnis abzulegen.