soul.py ajoute une mémoire persistante aux LLM locaux avec une approche simple basée sur des fichiers.

✍️ OpenClawRadar📅 Publié: March 2, 2026🔗 Source
soul.py ajoute une mémoire persistante aux LLM locaux avec une approche simple basée sur des fichiers.
Ad

soul.py est une bibliothèque Python qui fournit une mémoire persistante pour les sessions LLM locales en stockant l'historique des conversations dans des fichiers markdown lisibles par l'homme, éliminant le besoin de bases de données ou de serveurs en fonctionnement.

Fonctionnement

La bibliothèque crée deux fichiers markdown : SOUL.md pour les informations d'identité et MEMORY.md pour les journaux de conversation. Chaque fois que vous appelez agent.ask(), le système lit les deux fichiers dans l'invite système, traite la requête, puis ajoute l'échange à MEMORY.md. Cela permet à la mémoire de survivre entre les processus et les sessions.

Utilisation de base

Installation et configuration :

pip install soul-agent
soul init

Exemple d'implémentation avec Ollama :

from soul import Agent

agent = Agent( provider="openai-compatible", base_url="http://localhost:11434/v1", model="llama3.2", api_key="ollama" )

agent.ask("Je m'appelle Prahlad, je travaille dans un laboratoire de recherche en IA.")

Plus tard, dans une nouvelle session :

agent.ask("Que savez-vous de moi ?")

Réponse : "Vous êtes Prahlad, travaillant dans un laboratoire de recherche en IA."

Ad

Fonctionnalités clés

  • Fonctionne avec les modèles Ollama, OpenAI et Anthropic
  • Aucune base de données ou serveur requis
  • Fichiers markdown lisibles par l'homme
  • Versionnables avec Git et modifiables manuellement
  • La mémoire persiste entre les processus et les sessions
  • Conçu spécifiquement pour ajouter une mémoire persistante aux modèles locaux

L'outil a été créé pour résoudre le problème des LLM locaux qui oublient les informations entre les sessions, offrant une alternative légère aux solutions basées sur des bases de données.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

graphify-ts : Un serveur MCP local réduit les tokens de revue de PR de Claude Code de 63K à 8,7K
Tools

graphify-ts : Un serveur MCP local réduit les tokens de revue de PR de Claude Code de 63K à 8,7K

graphify-ts construit un graphe de connaissances local de votre codebase en utilisant l'AST de tree-sitter + les communautés Louvain + BM25 + un réordonnancement ONNX optionnel, et l'expose via MCP stdio. Dans les tests en production, il a réduit les tokens d'entrée de 2,6x et la latence de 2,8x pour les requêtes de code, et a réduit les prompts de revue de PR de 63K à 8,7K tokens.

OpenClawRadar
La nouvelle API de données structurées propose des tarifs d'abonnement pour les agents LLM.
Tools

La nouvelle API de données structurées propose des tarifs d'abonnement pour les agents LLM.

Un développeur a publié une API de données structurées qui normalise les tarifs d'abonnement sur les plateformes de streaming, les services de covoiturage, les applications de rencontre et d'autres plateformes basées sur l'abonnement. L'API fournit des schémas JSON cohérents, des tarifs adaptés à la région lorsque disponibles, et des points de terminaison compatibles MCP pour que les agents LLM puissent les consommer sans avoir à extraire des données.

OpenClawRadar
Compétences de l'Agent HuggingFace : Définitions standardisées de tâches d'IA pour les agents de programmation
Tools

Compétences de l'Agent HuggingFace : Définitions standardisées de tâches d'IA pour les agents de programmation

Les HuggingFace Skills sont des dossiers autonomes avec un en-tête YAML et des instructions pour que les agents d'IA exécutent des tâches de ML spécifiques comme la création de jeux de données, l'entraînement de modèles et l'évaluation. Ils sont interopérables avec OpenAI Codex, Claude Code d'Anthropic, Google Gemini CLI et Cursor.

OpenClawRadar
Compétence GAN pour Claude Code : Outil d'IA Adversaire pour l'Affinement d'Idées
Tools

Compétence GAN pour Claude Code : Outil d'IA Adversaire pour l'Affinement d'Idées

Une compétence Claude Code appelée /gan utilise des rôles d'IA adversariaux pour critiquer et améliorer les idées à travers des phases alternées de Discriminateur et de Générateur, avec des fonctionnalités comme les modes d'intensité, la sortie multilingue et la sélection forcée des rôles développées par auto-itération.

OpenClawRadar