iai-mcp : Un démon local pour une mémoire OpenClaw persistante entre sessions

La douleur récurrente de démarrer une nouvelle session OpenClaw sans aucun contexte a poussé un développeur à construire iai-mcp — un démon local qui conserve la mémoire des conversations entre les sessions. Après cinq mois d'utilisation quotidienne, il a été publié en open source sous licence MIT.
Comment ça marche
- Trois niveaux de mémoire : organise les conversations capturées par récence et pertinence, et les consolide en arrière-plan lorsque la machine est inactive.
- Plongements neuronaux locaux : tout le traitement se fait sur l'appareil ; aucune donnée n'est envoyée à l'extérieur.
- Chiffrement AES-256 : les données au repos sont chiffrées.
- Injection automatique du contexte : au démarrage d'une nouvelle session, la mémoire pertinente est fournie comme contexte — pas besoin de demander manuellement à OpenClaw de se souvenir de quoi que ce soit.
Chiffres de performance
- Rappel textuel supérieur à 99 %
- Latence de récupération inférieure à 100 ms
- Coût en tokens de démarrage inférieur à 3 000 tokens
Utilisation réelle
L'auteur utilise iai-mcp depuis janvier et rapporte que le système a appris le style de codage, les structures de projet et les préférences sans instructions explicites. Le dépôt inclut un banc d'essai pour vérifier les chiffres vous-même.
Dépôt : https://github.com/CodeAbra/iai-mcp
📖 Lire la source complète : r/clawdbot
👀 See Also

Gemini 3.1 Pro dans les systèmes multi-agents : Haute qualité de conception, taux d'échec des appels d'outils de 20 %
Les développeurs de Bobr, un générateur de présentations IA avec une architecture multi-agents, rapportent que Gemini 3.1 Pro produit des résultats de conception impressionnants mais souffre d'un taux d'échec d'appel d'outils d'environ 20 % et d'une corruption de texte incohérente dans les pipelines de production.

Application Mobile Hors Réseau Ajoute l'Utilisation d'Outils IA sur l'Appareil avec une Amélioration de Vitesse de 3x
L'application mobile Off Grid permet désormais aux modèles d'IA d'utiliser des outils comme la recherche web, la calculatrice, la date/heure et les informations du périphérique entièrement hors ligne, avec des options de cache KV configurables offrant jusqu'à 30 tokens/seconde sur les téléphones.

PACT 0.4.0 ajoute une intelligence composite pour les agents d'IA de codage.
PACT (Programmatic Agent Constraint Toolkit) version 0.4.0 introduit des fonctionnalités d'intelligence composée qui aident les agents d'IA de codage à conserver les connaissances entre les sessions. La mise à jour comprend la synthèse de recherche, un répertoire de connaissances et des systèmes de conscience des capacités.

Skillware ajoute un générateur de données synthétiques avec notation d'entropie pour l'affinage local des modèles.
Skillware a publié une nouvelle compétence de générateur de données synthétiques qui utilise des heuristiques de taux de compression zlib pour évaluer la diversité des sorties, aidant à prévenir l'effondrement du modèle. L'outil fonctionne immédiatement avec Ollama, prend en charge Gemini/Anthropic pour les lots à raisonnement élevé, et produit des lots JSON pour les pipelines de fine-tuning .jsonl.