soul.py fügt lokalen LLMs mit einem einfachen dateibasierten Ansatz persistente Speicherung hinzu

soul.py ist eine Python-Bibliothek, die persistente Speicherung für lokale LLM-Sitzungen bereitstellt, indem sie den Konversationsverlauf in menschenlesbaren Markdown-Dateien speichert, wodurch Datenbanken oder laufende Server überflüssig werden.
Funktionsweise
Die Bibliothek erstellt zwei Markdown-Dateien: SOUL.md für Identitätsinformationen und MEMORY.md für Konversationsprotokolle. Jedes Mal, wenn Sie agent.ask() aufrufen, liest das System beide Dateien in die Systemaufforderung ein, verarbeitet die Anfrage und fügt den Austausch dann an MEMORY.md an. Dadurch bleibt der Speicher über Prozesse und Sitzungen hinweg erhalten.
Grundlegende Verwendung
Installation und Einrichtung:
pip install soul-agent
soul initBeispielimplementierung mit Ollama:
from soul import Agent
agent = Agent(
provider="openai-compatible",
base_url="http://localhost:11434/v1",
model="llama3.2",
api_key="ollama"
)
agent.ask("Mein Name ist Prahlad, ich arbeite in einem KI-Forschungslabor.")
Später in einer neuen Sitzung:
agent.ask("Was wissen Sie über mich?")
Antwort: "Sie sind Prahlad und arbeiten in einem KI-Forschungslabor."
Hauptmerkmale
- Funktioniert mit Ollama-, OpenAI- und Anthropic-Modellen
- Keine Datenbank oder Server erforderlich
- Menschenlesbare Markdown-Dateien
- Git-versionierbar und manuell bearbeitbar
- Speicher bleibt über Prozesse und Sitzungen hinweg erhalten
- Speziell für die Hinzufügung von persistentem Speicher zu lokalen Modellen entwickelt
Das Tool wurde entwickelt, um das Problem zu lösen, dass lokale LLMs Informationen zwischen Sitzungen vergessen, und bietet eine leichtgewichtige Alternative zu datenbankgestützten Lösungen.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

Vergängliche OpenClaw-Einrichtungen mit Netzwerk-Sandboxing und automatischem Abbau
Ein Setup, das OpenClaw in einer ephemeren VM mit einer Netzwerk-Ausgangs-Allowlist startet, API-Schlüssel in RAM-gestützten Speicher injiziert und einen automatischen Abbau nach 2 Stunden beinhaltet. Alle LLM-Aufrufe werden für die Wiedergabe in SQLite aufgezeichnet.

RTX 5060 Ti 16GB Lokale LLM-Benchmarks: 30B-Modelle liegen beim Programmieren immer noch vorn
Benchmarks auf einer RTX 5060 Ti 16GB zeigen, dass Unsloth Qwen3-Coder-30B UD-Q3_K_XL unter Ubuntu 76,3 Tok/s bei einer Qualitätsbewertung von 8,14 erreicht, was es zum empfohlenen Standard-Codemodell macht. Das Unsloth Qwen3.5-35B UD-Q2_K_XL erreicht 80,1 Tok/s, jedoch mit niedrigeren Qualitätsbewertungen.
Zillow-Full: Eine OpenClaw-Fähigkeit, die manuelle Immobilienrecherche in eine automatisierte Deal-Pipeline verwandelte
Ein Entwickler baute 'zillow-full' auf OpenClaw, um Zestimates, Steuerhistorie, Preishistorie und Vergleiche pro Immobilie abzurufen. Mit einem nächtlichen Cron-Job, der Angebote anhand von Deal-Kriterien bewertete, stiegen die Großhandelsgeschäfte von 2 auf 11 pro Monat.

Savecraft MCP Server bietet Claude präzise Magic: The Gathering-Daten
Savecraft ist ein Open-Source-MCP-Server, der lokal die MTG Arena Player.log analysiert, den Spielstatus synchronisiert und Claude Zugang zu 12 Experten-Referenzmodulen bietet, die auf echten Magic: The Gathering-Daten basieren. Das Tool verhindert, dass Claude Kartenbezeichnungen und Regeln erfindet, indem es Zugriff auf tatsächliche Arena-Daten, Draft-Empfehlungen von 17Lands und die vollständige Scryfall-Datenbank bietet.