soul.py agrega memoria persistente a LLMs locales con un enfoque simple basado en archivos.

soul.py es una biblioteca de Python que proporciona memoria persistente para sesiones locales de LLM almacenando el historial de conversaciones en archivos markdown legibles por humanos, eliminando la necesidad de bases de datos o servidores en ejecución.
Cómo funciona
La biblioteca crea dos archivos markdown: SOUL.md para información de identidad y MEMORY.md para registros de conversaciones. Cada vez que llamas a agent.ask(), el sistema lee ambos archivos en el mensaje del sistema, procesa la consulta y luego añade el intercambio a MEMORY.md. Esto permite que la memoria sobreviva entre procesos y sesiones.
Uso básico
Instalación y configuración:
pip install soul-agent
soul initEjemplo de implementación con Ollama:
from soul import Agent
agent = Agent(
provider="openai-compatible",
base_url="http://localhost:11434/v1",
model="llama3.2",
api_key="ollama"
)
agent.ask("Mi nombre es Prahlad, trabajo en un laboratorio de investigación de IA.")
Más tarde, en una nueva sesión:
agent.ask("¿Qué sabes sobre mí?")
Devuelve: "Eres Prahlad, trabajas en un laboratorio de investigación de IA."
Características principales
- Funciona con modelos de Ollama, OpenAI y Anthropic
- No requiere base de datos ni servidor
- Archivos markdown legibles por humanos
- Versionable con Git y editable manualmente
- La memoria persiste entre procesos y sesiones
- Creado específicamente para añadir memoria persistente a modelos locales
La herramienta fue creada para resolver el problema de que los LLM locales olvidan información entre sesiones, proporcionando una alternativa ligera a soluciones respaldadas por bases de datos.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Automatización de la Triage de Alertas de Datadog con Claude Code y MCP
Un desarrollador creó un sistema usando las habilidades de Claude Code y el servidor MCP de Datadog para verificar automáticamente alertas de monitoreo, clasificar problemas y abrir PRs de corrección mediante un trabajo cron. La configuración toma unos 30 minutos y ejecuta agentes de IA en paralelo en worktrees aislados.

CostClaw: Panel de Seguimiento de Costos Local Gratuito para Agentes OpenClaw
CostClaw es un complemento local gratuito que captura cada llamada de LLM mediante los enlaces nativos de OpenClaw y proporciona un panel de control que muestra desgloses de modelos, costos por sesión y gráficos de gasto por hora. El desarrollador descubrió que su agente de latido ejecutaba Claude Sonnet cada 3 minutos las 24 horas del día, costando $60 al mes, y cambiarlo a Haiku redujo su factura en aproximadamente un 65%.

Unsloth Studio permite duplicar la velocidad de entrenamiento con una reducción del 70% en VRAM para el ajuste local de IA.
Unsloth Studio proporciona herramientas para entrenar y ajustar modelos de lenguaje en hardware local con un entrenamiento 2 veces más rápido y una reducción del 70% en VRAM. Admite exportar modelos al formato GGUF para usar con Ollama y permite flujos de trabajo completos de codificación con IA local en hardware de 24 GB como la RTX 4090.

DeepSeek Reasonix: Agente de Codificación Nativa con Alto Caching y Bajo Costo
Reasonix es un agente de codificación de IA nativo para DeepSeek en terminal, centrado en alta eficiencia de caché y bajo costo de inferencia.