soul.py: Memoria persistente para LLMs locales con archivos

soul.py es una biblioteca de Python que proporciona memoria persistente para sesiones locales de LLM almacenando el historial de conversaciones en archivos markdown legibles por humanos, eliminando la necesidad de bases de datos o servidores en ejecución.

Cómo funciona

La biblioteca crea dos archivos markdown: SOUL.md para información de identidad y MEMORY.md para registros de conversaciones. Cada vez que llamas a agent.ask(), el sistema lee ambos archivos en el mensaje del sistema, procesa la consulta y luego añade el intercambio a MEMORY.md. Esto permite que la memoria sobreviva entre procesos y sesiones.

Uso básico

Instalación y configuración:

pip install soul-agent
soul init

Ejemplo de implementación con Ollama:

from soul import Agent

agent = Agent(
    provider="openai-compatible",
    base_url="http://localhost:11434/v1",
    model="llama3.2",
    api_key="ollama"
)
agent.ask("Mi nombre es Prahlad, trabajo en un laboratorio de investigación de IA.")
Más tarde, en una nueva sesión:
agent.ask("¿Qué sabes sobre mí?")
Devuelve: "Eres Prahlad, trabajas en un laboratorio de investigación de IA."

Características principales

Funciona con modelos de Ollama, OpenAI y Anthropic
No requiere base de datos ni servidor
Archivos markdown legibles por humanos
Versionable con Git y editable manualmente
La memoria persiste entre procesos y sesiones
Creado específicamente para añadir memoria persistente a modelos locales

La herramienta fue creada para resolver el problema de que los LLM locales olvidan información entre sesiones, proporcionando una alternativa ligera a soluciones respaldadas por bases de datos.

📖 Read the full source: r/LocalLLaMA

soul.py agrega memoria persistente a LLMs locales con un enfoque simple basado en archivos.

Cómo funciona

Uso básico

Más tarde, en una nueva sesión:

`Devuelve: "Eres Prahlad, trabajas en un laboratorio de investigación de IA."`

Características principales

👀 Ver también

La Optimización de ANE Mediante Experimentos de IA Dirigidos por Teléfono Muestra los Beneficios de la Fusión de Núcleos

Savant Commander 48B: Un modelo personalizado Qwen 3 de Mezcla de Expertos con 12 modelos destilados

El complemento Claude Code analiza cualquier complemento y genera informes wiki interactivos.

yoyo: Servidor MCP local para lecturas fundamentadas de bases de código y escrituras controladas con Claude Code