Offline-Web-Suche: BM25 & SQLite FTS5 für KI-Agenten

Was das ist

offline-web-search ist eine vollständig lokale Google-Suche-Alternative, die speziell für KI-Agenten entwickelt wurde, die Offline-Websuche benötigen. Es wurde als direkter Ersatz für Claudes Web-Tools erstellt, sodass LLMs es ohne komplexe Prompting verwenden können.

Das Kernproblem, das gelöst wird

Der Entwickler stellte fest, dass bestehende Offline-Suchlösungen für KI-Agenten erhebliche Einschränkungen haben. Die meisten Tools werfen entweder rohe HTML-Dateien in das Kontextfenster oder haben grundlegende Suchfunktionen, die es Agenten unmöglich machen, spezifische Dokumentation zu finden. Dies ist besonders problematisch in abgeschotteten Umgebungen, bei der Verarbeitung sensibler Daten oder beim Aufbau vollständig lokaler Stacks.

Wichtige technische Funktionen

Suchmaschinenverhalten: Anstatt Textdumps zu verwenden, indiziert es Inhalte in eine lokale SQLite FTS5-Datenbank mit BM25-Ranking, Titel-Boosting, Synonym-Erweiterung, Präfix-Matching und Nicht-Englisch-Abstufung.
Inhaltsquellen: Unterstützt nativ Kiwix ZIM-Archive (mit Offline-Snapshots von Stack Overflow, Python-Dokumentation, DevDocs, Wikipedia) und enthält eine Indizierungs-API und einen Crawler für benutzerdefinierte Inhalte wie internes Confluence, Unternehmensdokumente oder zufällige HTML-Seiten.
Architektur: Verwendet ein Client-Server-Modell mit einer HTTP-API. Der "schwere" Content-Server läuft zentral in Ihrem Netzwerk, während schlanke Clients über einen MCP-Server für Claude Desktop oder die native Claude Code-Fähigkeit verbinden.
Verfügbare Tools: Bietet zwei Standard-Tools: Google Search für BM25-basierte Suche und visit_page, um sauberes Markdown vollständiger Seiten zurückzugeben.

Wie es funktioniert

Das Tool wurde durch Reverse-Engineering von Claudes Web-Fetch- und Web-Search-Tools, ihren System-Prompts und ihrer Funktionalität erstellt. Suchergebnisse liefern dem LLM hochrelevante, gerankte Ausschnitte, die dann das visit_page-Tool verwenden können, um saubere, lesbare Markdown-Versionen vollständiger Seiten abzurufen.