Recherche web hors ligne : alternative locale à Google Search pour IA

Ce que c'est

offline-web-search est une alternative entièrement locale à Google Search conçue spécifiquement pour les agents d'IA qui ont besoin de capacités de recherche web hors ligne. Il a été créé comme un remplacement direct pour les outils web de Claude, permettant aux LLM de l'utiliser sans instructions complexes.

Problème central résolu

Le développeur a identifié que les solutions de recherche hors ligne existantes pour les agents d'IA présentent des limitations importantes. La plupart des outils déversent soit des fichiers HTML bruts dans la fenêtre de contexte, soit ont une fonctionnalité de recherche basique qui empêche les agents de trouver une documentation spécifique. Cela est particulièrement problématique dans les environnements isolés, lors de la manipulation de données sensibles, ou lors de la construction de piles entièrement locales.

Caractéristiques techniques clés

Comportement du moteur de recherche : Au lieu de déversements de texte, il indexe le contenu dans une base de données SQLite FTS5 locale en utilisant le classement BM25, la priorisation des titres, l'expansion des synonymes, la correspondance par préfixe et la dégradation des langues non anglaises.
Sources de contenu : Prend en charge nativement les archives Kiwix ZIM (contenant des instantanés hors ligne de Stack Overflow, de la documentation Python, de DevDocs, de Wikipédia) et inclut une API d'indexation et un robot d'exploration pour du contenu personnalisé comme Confluence interne, la documentation de l'entreprise ou des pages HTML aléatoires.
Architecture : Utilise un modèle client-serveur avec une API HTTP. Le serveur de contenu « lourd » fonctionne de manière centrale sur votre réseau, tandis que les clients légers se connectent via un serveur MCP pour Claude Desktop ou la compétence native Claude Code.
Outils exposés : Fournit deux outils standard : Google Search pour la recherche classée BM25 et visit_page pour renvoyer une version Markdown propre des pages complètes.

Comment ça fonctionne

L'outil a été construit en rétro-ingénierie des outils Web-Fetch et Web-Search de Claude, de leurs instructions système et de leur fonctionnalité. Les résultats de recherche fournissent des extraits hautement pertinents et classés au LLM, qui peut ensuite utiliser l'outil visit_page pour accéder à des versions Markdown propres et lisibles des pages complètes.

À qui il est destiné

Les développeurs qui construisent des agents d'IA hors ligne ou des configurations fortement locales et qui ont besoin de capacités de recherche fiables sans accès à Internet.

📖 Lire la source complète : r/ClaudeAI

Recherche web hors ligne : Une alternative locale à Google Search pour les agents IA

Ce que c'est

Problème central résolu

Caractéristiques techniques clés

Comment ça fonctionne

À qui il est destiné

👀 See Also

htmLLM-124M v2 publié : Modèle d'autocomplétion HTML/Bootstrap spécialisé

OpenClaw PARA Compétence Organise Automatiquement les Fichiers en Utilisant la Méthode de Tiago Forte.

Lancement du Moteur MCP Server Offrant un Pipeline de 39 Outils pour la Validation Commerciale

Agent IA intégré dans le shell : Extension de tampon terminal et de superposition