Offline-Web-Suche: Eine lokale Google-Suchalternative für KI-Agenten

Was das ist
offline-web-search ist eine vollständig lokale Google-Suche-Alternative, die speziell für KI-Agenten entwickelt wurde, die Offline-Websuche benötigen. Es wurde als direkter Ersatz für Claudes Web-Tools erstellt, sodass LLMs es ohne komplexe Prompting verwenden können.
Das Kernproblem, das gelöst wird
Der Entwickler stellte fest, dass bestehende Offline-Suchlösungen für KI-Agenten erhebliche Einschränkungen haben. Die meisten Tools werfen entweder rohe HTML-Dateien in das Kontextfenster oder haben grundlegende Suchfunktionen, die es Agenten unmöglich machen, spezifische Dokumentation zu finden. Dies ist besonders problematisch in abgeschotteten Umgebungen, bei der Verarbeitung sensibler Daten oder beim Aufbau vollständig lokaler Stacks.
Wichtige technische Funktionen
- Suchmaschinenverhalten: Anstatt Textdumps zu verwenden, indiziert es Inhalte in eine lokale SQLite FTS5-Datenbank mit BM25-Ranking, Titel-Boosting, Synonym-Erweiterung, Präfix-Matching und Nicht-Englisch-Abstufung.
- Inhaltsquellen: Unterstützt nativ Kiwix ZIM-Archive (mit Offline-Snapshots von Stack Overflow, Python-Dokumentation, DevDocs, Wikipedia) und enthält eine Indizierungs-API und einen Crawler für benutzerdefinierte Inhalte wie internes Confluence, Unternehmensdokumente oder zufällige HTML-Seiten.
- Architektur: Verwendet ein Client-Server-Modell mit einer HTTP-API. Der "schwere" Content-Server läuft zentral in Ihrem Netzwerk, während schlanke Clients über einen MCP-Server für Claude Desktop oder die native Claude Code-Fähigkeit verbinden.
- Verfügbare Tools: Bietet zwei Standard-Tools:
Google Searchfür BM25-basierte Suche undvisit_page, um sauberes Markdown vollständiger Seiten zurückzugeben.
Wie es funktioniert
Das Tool wurde durch Reverse-Engineering von Claudes Web-Fetch- und Web-Search-Tools, ihren System-Prompts und ihrer Funktionalität erstellt. Suchergebnisse liefern dem LLM hochrelevante, gerankte Ausschnitte, die dann das visit_page-Tool verwenden können, um saubere, lesbare Markdown-Versionen vollständiger Seiten abzurufen.
Für wen es gedacht ist
Entwickler, die Offline-KI-Agenten oder stark lokale Setups aufbauen und zuverlässige Suchfunktionen ohne Internetzugang benötigen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Top 6 Open-Source-Claude-Fähigkeiten (15. April – 3. Mai)
Sechs Open-Source-Claude-Skills aus den letzten 15 Tagen: Brand-Alchemy, npm-Downloads-to-Leads, Hyperframes, Email-Newsletter, Pricing und mehr. Detaillierte Aufschlüsselung der Funktionalität jedes Skills.

Memtrace: Beständiger, zeitbewusster Codebase-Speicher für Claude Code-Agenten
Memtrace liefert stets aktuelle Snapshots und bi-temporales Replay für Claude Code Agents. Es nutzt Tree-sitter AST-Parsing und hybrides Retrieval (BM25 + Jina-code-Embeddings) ohne LLM-Inferenzkosten während der Indexierung.

Claude VS Code-Erweiterung: "Reasoning Effort"-Schieberegler sendet inkonsistente Werte
Der Reasoning-Effort-Schieberegler in der Claude VS Code-Erweiterung sendet inkonsistente numerische Werte an das Modell, mit einer nicht-monotonen Zuordnung, bei der das Verschieben des Reglers nach oben eine niedrigere Zahl senden kann.

Anwendung der Claude-Code-Architektur auf lokale 9B-Modelle: Wichtige Erkenntnisse und Optimierungen
Ein Entwickler extrahierte Architekturmuster aus dem geleakten Quellcode von Claude Code und wandte 10 Optimierungen auf qwen3.5:9b an, das lokal auf einer RTX 5070 Ti läuft. Die wichtigste Erkenntnis war, dass qwen3.5:9b native strukturierte tool_calls hat, und die größte Einschränkung für 9B-Modelle ist die Selbstdisziplin, zu wissen, wann man mit dem Erkunden aufhören und mit der Ausgabeerzeugung beginnen soll.