OmniRecall Beta : Injection de mémoire propulsée par FAISS pour les discussions LLM en cloud

Ce que fait OmniRecall
OmniRecall est un contournement local de mitmproxy qui intercepte le trafic vers les interfaces de chat cloud (testé sur DeepSeek). Il s'introduit dans le flux de fragments SSE propriétaire et impose une couche de mémoire à long terme sur un système conçu pour être sans état.
Mécanisme technique
- Analyse approfondie des paquets : Reconstitue la réponse complète de l'assistant en suivant les correctifs en temps réel
- Contrôle des commandes : Détecte [ADD], [UPDATE], [REMOVE], [CLEAR] dans la sortie de l'IA
- Cerveau local : Maintient memory.txt + index FAISS (sentence-transformers MiniLM-L6)
- Injection de contexte : Les faits les mieux rappelés sont injectés de force dans votre prochain message sous forme de [RECALL: ...]
État actuel et limites
Il s'agit d'une version bêta/expérimentale. Le développeur note : "C'est le plus proche que j'ai pu atteindre du rêve après des semaines d'enfer de débogage. C'est buggé. C'est expérimental. [ADD] est assez stable, mais [SEARCH] est capricieux — si vous voulez la perfection, corrigez-le vous-même. J'ai atteint ma limite d'énergie sur cette version."
Les modifications de l'interface utilisateur en amont vont le casser. Le développeur déclare : "S'il casse, c'est votre problème maintenant."
Exigences et configuration
Exigences pour PC modeste :
- CPU uniquement (faiss-cpu + all-MiniLM-L6-v2)
- Aucun LLM local nécessaire — améliore les modèles cloud que vous utilisez déjà
- Coût nul, aucune clé API, isolement des données 100 % local
Comment déployer :
pip install mitmproxy faiss-cpu sentence-transformers numpyFaites confiance au certificat CA de mitmproxy sur votre système/navigateur (exécutez mitmproxy une fois pour le générer). Définissez le proxy système sur 127.0.0.1:8080. Puis exécutez :
mitmdump -s omnirecall.pyAllez sur chat.deepseek.com et commencez à lui fournir des souvenirs.
Conditions de licence
Le projet utilise une licence source-disponible très restrictive :
- Aucune utilisation commerciale
- Aucun fork privé
- ALTERATIONS.md obligatoire et public pour toute modification de la logique
- Si vous l'adaptez pour Claude/GPT-4o/etc., gardez-le public conformément à la licence
Le développeur explique : "J'ai vu trop de projets de développeurs solo être exploités, privatisés ou transformés en SaaS payant tandis que le créateur ne reçoit rien. Cette licence n'est pas amicale — elle est conçue pour protéger le travail précisément de ces personnes. Si les conditions vous effraient, c'est le but."
📖 Read the full source: r/LocalLLaMA
👀 See Also

Développeur Crée le Langage de Programmation GALA avec Claude Code, Note que le Typage Fort Améliore la Fiabilité du Code Généré par l'IA
Un développeur a créé GALA, un langage de programmation fonctionnel qui se transpile en Go, en utilisant abondamment Claude Code. Le langage propose des types scellés, un filtrage par motif exhaustif, l'immutabilité par défaut et des monades, avec l'aide de Claude pour implémenter l'inférence de types, les transformateurs de filtrage par motif et la correction de plus de 40 bugs.

Argus : Une application GitHub qui examine les fichiers CLAUDE.md et publie les scores sur les PRs
Argus est une application GitHub créée avec Claude Code qui examine les fichiers CLAUDE.md et publie un score sur chaque demande de tirage. Après des tests sur plusieurs dépôts, les échecs les plus courants sont l'absence de limites de portée explicites et de chemins d'escalade.

Maîtriser les Modes d'Abonnement Antropic : Haiku, Sonnet et Opus
Découvrez les modes d'abonnement innovants d'Antropic—Haiku, Sonnet et Opus—conçus pour enrichir votre expérience de codage IA avec des fonctionnalités et tarifs adaptés.

codebase-md : L'outil génère automatiquement CLAUDE.md avec maintenance des hooks git
codebase-md v0.1.0 analyse les projets pour générer des fichiers CLAUDE.md avec détection d'architecture, vérifications de santé des dépendances et insights git. Il inclut des hooks git pour maintenir la documentation à jour et prend en charge d'autres outils d'IA de codage avec des fichiers de configuration supplémentaires.