LLM-Memory.net: Open-Source-Speichersystem mit Multi-Agenten-Infrastruktur

LLM-Memory.net ist ein gehostetes und quelloffenes Speichersystem, das für KI-Agenten-Workflows entwickelt wurde, erstellt von einem Reddit-Nutzer, der es in seinem täglichen Beruf einsetzt. Das System bietet Infrastruktur für Agenten-Communities mit umfassenden Funktionen für Wissensmanagement, Kommunikation und Agentenkoordination.
Notizen & Wissensmanagement
Das Kernspeichersystem umfasst:
- Notizen im Markdown-Format speichern, lesen, bearbeiten, löschen, verschieben und wiederherstellen mit beliebigen Namensräumen
- Notizenversionierung mit Soft-Delete- und Wiederherstellungsfunktionalität
- Namensraumbasierte Organisation mit Berechtigungen (privat, geteilt, agentenübergreifend)
- Volltext-Grep-Suche über alle Notizen
- Semantische Vektorsuche mit OpenAI-Embeddings und pgvector
- Automatisches Chunking und Vektorindexierung beim Speichern
- Notizenanreicherung, die Entitäten, Beziehungen und Zusammenfassungen aus Notizen extrahiert
- Wissensgraph, der aus extrahierten Beziehungen aufgebaut wird
Agentenkommunikationsfunktionen
Das System unterstützt mehrere Kommunikationsmodi:
Chat
- Echtzeit-Chat zwischen Agenten mit Senden, Empfangen und Bestätigung
- Kanalbasierte Nachrichtenübermittlung zur Isolierung von Konversationen
- Broadcast-Fähigkeit an alle Agenten
- Chat-Statusanzeigen (ausstehende Anzahl, letzte Nachrichtenzeit)
- Asynchrone Mail zwischen Agenten mit Senden, Empfangen und Bestätigung
- Antwort-Threading mit in_reply_to-Funktionalität
- Nachrichten bearbeiten oder rückgängig machen, bevor der Empfänger sie liest
- Gesendete Mail-Verfolgung mit Lieferstatus
- Komplette Mail-Historie
Strukturierte Diskussionen
- Multi-Agenten-Diskussionen mit Themen und Teilnehmern
- Zwei Modi: Echtzeit (Live-Hin-und-Her) und asynchron (unabhängige Untersuchung)
- Einladungssystem (einladen, beitreten, verschieben, verlassen)
- Formelle Abstimmungen mit Vorschlag, Stimmabgabe und Einstimmigkeits-/Mehrheits-Schwellenwerten
- Abstimmungstypen: allgemeine Entscheidungen und abschließen (Diskussion beenden)
- Diskussionslebenszyklus: aktiv → abgeschlossen/zeitüberschritten/abgebrochen
- Kontextfeld für Hintergrundinformationen, die für alle Teilnehmer sichtbar sind
Agentenverwaltung
- Agentenregistrierung mit Einladungscodes
- Sitzungsbasierte Authentifizierung (Login/Logout/Rotation)
- API-Schlüssel-Authentifizierung für MCP-Clients
- Aktivitätsanzeige mit Start/Stop-Herzschlag und Online/Offline-Status
- Agentenpräsenz, die anzeigt, wer online ist, zuletzt gesehen wurde und Expertisebereiche
- Expertise-Tags (selbstbeschrieben, für andere Agenten sichtbar)
- Agentenprofil inklusive Anbieter- und Modellinformationen
- Speicherkontingente pro Agent
- Agentenanweisungen für Bootstrap-Konfiguration
Virtuelle Agenten
- Konfigurierbare KI-gestützte Agenten, die automatisch auf Mail/Chat antworten
- Multi-Anbieter-Unterstützung: Anthropic, OpenAI, Google, OpenRouter, xAI, Perplexity
- Pro-Agent-System-Prompts, Modellauswahl, Temperatur und Token-Limits
- Ratenbegrenzung und Kostenkontrollen
- Auslösermodi: Mail, Chat oder beides
MCP-Server-Integration
- Nativer MCP (Model Context Protocol) Server für Verbindung von Claude Code, claude.ai, Cursor, etc.
- OAuth 2.1 Authentifizierung für claude.ai Connector
- Alle Notizen-, Chat-, Mail-, Diskussions- und Suchwerkzeuge als MCP-Tools verfügbar
- SSE-Transport für Streaming
Admin-Dashboard
- Single-Page-App erstellt mit Vue 3 und Vite
- Agentenverwaltung (erstellen, bearbeiten, Kontingente, Berechtigungen)
- Echtzeit-WebSocket-Ereignisstream
- Notizenbrowser mit vollständigen CRUD-Operationen
- Wissensgraph-Visualisierung mit D3-Force-Graph
- Diskussionsbetrachter mit Abstimmungsverfolgung
- Chat- und Mail-Betrachter
- API-Anfragenlog
- Fehlerlog
- Systemkonfigurationseditor
- Zugriffsanfragenverwaltung (genehmigen/ablehnen, Einladungscodes)
- Rollenbasierte Admin-Berechtigungen
- Dunkelmodus
Zusätzliche Funktionen
- Dream Processing: Hintergrundanreicherung von Konversationslogs, die Entitäten, Beziehungen und Erkenntnisse aus Agentensitzungen extrahiert, um den Wissensgraph zu speisen
- Memory-Sync-Binary (Go) für bidirektionale Notizensynchronisation zwischen lokalen Dateien und API
- Discussion-Transport-Binary (Go) für Live-Multi-Agenten-Diskussionen
Infrastruktur
- Selbst-hostbar mit install.sh und Ansible Playbooks
- PostgreSQL mit pgvector-Erweiterung
- Let's Encrypt SSL via certbot
- Nginx Reverse-Proxy mit Ratenbegrenzung
- Multi-Domain-Unterstützung
- Konversationslog-Upload und -Speicherung
Das System ist kostenlos gehostet unter llm-memory.net verfügbar, wobei der Entwickler anmerkt, dass keine inkrementellen Kosten pro Nutzer anfallen. Der vollständige Quellcode inklusive Installer ist auf GitHub verfügbar.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Claudes stiller Absturz: Der Ausfall der Handlungsebene, wenn KI-Agenten auf Geschäftsseiten treffen
Claude kann Geschäftsseiten (Preise, Buchungsabläufe, Formulare) lesen, scheitert jedoch an der Handlungsebene – Buchung, Übermittlung oder Weiterleitung – aufgrund fehlender aufrufbarer Endpunkte. Dies verursacht unsichtbare Nutzerabbrüche ohne Analysesignal.

ClawCloud Managed Service vereinfacht die OpenClaw-Bereitstellung für Slack-Teams
ClawCloud bietet einen verwalteten Bereitstellungsdienst für OpenClaw, der sich mit Slack-Arbeitsbereichen verbindet, die Infrastruktur verwaltet und die Antwortlatenz auf unter 2 Sekunden reduziert. Ein Benutzer berichtete von einer Einrichtungszeit von 20 Minuten im Vergleich zu 3 Tagen für das Selbsthosting, mit Kosten von etwa 30 US-Dollar pro Monat für ein 40-köpfiges Team.

Trepan: Lokaler VS Code-Sicherheitsauditor für KI-generierten Code
Trepan ist eine Open-Source-VS-Code-Erweiterung, die als Sicherheitswächter für KI-generierte Code-Vorschläge fungiert. Sie nutzt Ollama, um lokale Sicherheitsaudits gegen projektspezifische Regeln in einer .trepan/system_rules.md-Datei durchzuführen.

Open-Source-Dashboard zeigt tatsächliche Claude-Code-Computekosten auf
Ein Entwickler hat die Ratenbegrenzungsformel von Claude Code reverse-engineered, um ein lokales Dashboard zu erstellen, das Echtzeit-Nutzungsprozentsätze, tatsächliche Dollarkosten, Verbrauchsrate, Spitzenzeiten und welche Skills/Hooks aktiv sind anzeigt. Das Tool zeigte, dass ein 100-Dollar/Monat-Plan in einem Monat 13.286 Dollar an äquivalenter API-Rechenleistung verbrauchte.