soul.py agrega memoria persistente a LLMs locales con un enfoque simple basado en archivos.

soul.py es una biblioteca de Python que proporciona memoria persistente para sesiones locales de LLM almacenando el historial de conversaciones en archivos markdown legibles por humanos, eliminando la necesidad de bases de datos o servidores en ejecución.
Cómo funciona
La biblioteca crea dos archivos markdown: SOUL.md para información de identidad y MEMORY.md para registros de conversaciones. Cada vez que llamas a agent.ask(), el sistema lee ambos archivos en el mensaje del sistema, procesa la consulta y luego añade el intercambio a MEMORY.md. Esto permite que la memoria sobreviva entre procesos y sesiones.
Uso básico
Instalación y configuración:
pip install soul-agent
soul initEjemplo de implementación con Ollama:
from soul import Agent
agent = Agent(
provider="openai-compatible",
base_url="http://localhost:11434/v1",
model="llama3.2",
api_key="ollama"
)
agent.ask("Mi nombre es Prahlad, trabajo en un laboratorio de investigación de IA.")
Más tarde, en una nueva sesión:
agent.ask("¿Qué sabes sobre mí?")
Devuelve: "Eres Prahlad, trabajas en un laboratorio de investigación de IA."
Características principales
- Funciona con modelos de Ollama, OpenAI y Anthropic
- No requiere base de datos ni servidor
- Archivos markdown legibles por humanos
- Versionable con Git y editable manualmente
- La memoria persiste entre procesos y sesiones
- Creado específicamente para añadir memoria persistente a modelos locales
La herramienta fue creada para resolver el problema de que los LLM locales olvidan información entre sesiones, proporcionando una alternativa ligera a soluciones respaldadas por bases de datos.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Forge: un IDE basado en Claude con verificación automatizada y ADN de proyecto.
Forge es un IDE basado en Claude construido sobre VS Code que ejecuta automáticamente verificaciones de tipos, pruebas, comprobaciones de cobertura y validación de importaciones antes de mostrar el código. Incluye bucles de autocorrección para verificaciones fallidas y construye un ADN del Proyecto de los patrones de tu base de código.

Kvaser: Un orquestador de IA local-first de código abierto con enrutamiento de subagentes e integración con Wolfram
Kvaser es un proxy MCP de intermediario que orquesta subagentes con listas blancas inteligentes de herramientas, RAG sin incrustaciones a través de Kiwix e integración con Wolfram Engine para matemática simbólica. Construido con Qwen 3.6 35B y enrutamiento de subagentes a diferentes modelos/máquinas.

TUI Studio: Herramienta de Diseño de Interfaz de Usuario Visual para Terminales en Fase Alfa
TUI Studio es un editor visual similar a Figma para diseñar interfaces de usuario de terminal con componentes de arrastrar y soltar, vista previa ANSI en tiempo real y exportación planificada a seis frameworks incluyendo Ink, BubbleTea y Textual. Actualmente en fase alfa con exportaciones no funcionales, está disponible para macOS, Windows y Docker.

Gestión Automatizada del Estado de Sesión para la Transferencia de Código de Claude
Un proyecto de GitHub proporciona ganchos automatizados para mantener un archivo de estado de sesión en vivo (.claude/session-state.md) a lo largo de las conversaciones con Claude, abordando la pérdida de contexto por autocompactación y la degradación del contexto a mitad de conversación. El sistema utiliza cuatro scripts bash con jq para rastrear eventos importantes y ediciones de archivos.