La recherche hybride avec RRF améliore le système de mémoire de l'IA par rapport à la recherche vectorielle pure.

✍️ OpenClawRadar📅 Publié: April 15, 2026🔗 Source
La recherche hybride avec RRF améliore le système de mémoire de l'IA par rapport à la recherche vectorielle pure.
Ad

Un système de mémoire open-source pour assistants IA a été développé, utilisant PostgreSQL avec pgvector dans une configuration locale et auto-hébergée. Le système stocke des informations pour que les assistants IA puissent s'en souvenir entre les sessions et les rend consultables.

Pourquoi la recherche vectorielle pure ne suffisait pas

Le développeur a commencé avec une recherche vectorielle pure : intégration des requêtes, utilisation de la similarité cosinus et renvoi des k meilleurs résultats. Bien que cela fonctionnait pour des questions vagues, cela échouait systématiquement sur les correspondances exactes. Par exemple, rechercher "RRF merging" renvoyait des extraits sur "combining ranked lists" datant de plusieurs mois au lieu du document qui dit littéralement "RRF merging".

Solution de recherche hybride

La solution a impliqué l'ajout d'un deuxième bras de recherche : la recherche en texte intégral utilisant tsvector de PostgreSQL avec un index GIN. Cette correspondance par mots-clés capture ce que la recherche vectorielle manque. Cependant, cela a créé deux listes classées qui devaient être fusionnées.

Fusion de Rangs Réciproque (RRF)

La Fusion de Rangs Réciproque s'est avérée être la solution pour fusionner les deux listes classées. La formule est simple : score = 1 / (k + rang), où k=60 (la valeur standard). Les résultats qui apparaissent dans les deux listes obtiennent les deux scores additionnés. Cette approche ne nécessite aucun réglage de poids et aucune normalisation de score entre la similarité cosinus et ts_rank—elle utilise uniquement les positions de rang.

Ad

Technique d'enrichissement des requêtes

Avant la recherche, le système passe les requêtes dans le tokenizer WordPiece du modèle d'intégration pour extraire les termes clés (jetons multi-sous-mots qui sont probablement techniques ou spécifiques au domaine). Cela génère jusqu'à 3 variations de requête, intègre toutes et recherche en parallèle. Cela capture les résultats qu'une formulation pourrait manquer.

Stack technique

  • PostgreSQL 16 + pgvector (index HNSW pour les vecteurs, index GIN pour le texte intégral)
  • all-MiniLM-L6-v2 pour les intégrations (384 dimensions, fonctionne sur CPU)
  • Python avec psycopg 3 asynchrone
  • 3 adaptateurs d'ingestion : markdown, texte brut et JSON de conversation Claude

L'ensemble du système fonctionne localement sans appels API pour les intégrations et sans dépendances cloud. Le code a été récemment livré, et le développeur a écrit un article de blog détaillé sur l'approche complète.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Comparaison des agents IA locaux et cloud : OpenClaw et Twin.so
Tools

Comparaison des agents IA locaux et cloud : OpenClaw et Twin.so

OpenClaw est un agent d'IA local open-source qui s'exécute sur votre machine avec un contrôle total des données, tandis que Twin.so est une plateforme cloud avec plus de 200 000 agents créés par la communauté pour une automatisation 24h/24 et 7j/7.

OpenClawRadar
Salle des Agents : Application de Bureau pour Visualiser les Équipes d'Agents de Code Claude
Tools

Salle des Agents : Application de Bureau pour Visualiser les Équipes d'Agents de Code Claude

Agents Room est une application de bureau Electron qui scanne les dossiers .claude/agents/, lit les métadonnées frontmatter et visualise les relations entre agents sur un canevas avec des lignes de connexion automatiques. Elle permet de créer/modifier des agents, compétences et commandes directement dans l'interface utilisateur au lieu d'éditer des fichiers markdown.

OpenClawRadar
Custom Reddit MCP pour Claude Desktop/Code partagé sur GitHub
Tools

Custom Reddit MCP pour Claude Desktop/Code partagé sur GitHub

Un développeur a publié un MCP Reddit personnalisé conçu pour Claude Desktop et Claude Code afin d'intégrer directement la recherche Reddit dans le flux de travail. L'outil est documenté sur GitHub et disponible gratuitement.

OpenClawRadar
Extraction des composants d'OpenClaw : L'expérience d'un développeur avec la file d'attente de voie et le système de mémoire
Tools

Extraction des composants d'OpenClaw : L'expérience d'un développeur avec la file d'attente de voie et le système de mémoire

Un développeur a tenté d'extraire des composants spécifiques d'OpenClaw pour les utiliser dans ses propres agents d'IA, testant le système d'exécution de tâches Lane Queue et examinant le système de mémoire memsearch. La Lane Queue a été réimplémentée avec succès en Python à partir de la documentation, révélant des lacunes dans celle-ci et 13 problèmes d'implémentation.

OpenClawRadar