Signet: Open-Source Memory Layer für KI-Codierungsagenten erreicht 80 % F1 bei LoCoMo

Signet ist ein Open-Source-Gedächtnissystem, das für KI-Coding-Agenten wie Claude Code, OpenCode, OpenClaw und Codex entwickelt wurde. Es behandelt das Gedächtnismanagement, indem es die Gedächtnisextraktion vom Konversationsfluss des Agenten trennt.
Leistung und Ansatz
Das System erreichte kürzlich 80 % F1 auf dem LoCoMo-Benchmark, der das Langzeit-Konversationsgedächtnis bewertet. Zum Vergleich: Standard-RAG erzielt etwa 41 % auf diesem Benchmark, GPT-4 mit vollem Kontext 32 %, und die menschliche Obergrenze liegt bei 87,9 %.
Im Gegensatz zu Ansätzen, die Agenten ein "Erinnerungs"-Tool geben, kehrt Signet die Architektur um:
- Erinnerungen werden nach jeder Sitzung durch eine separate LLM-Pipeline extrahiert – keine Tool-Aufrufe während der Konversation
- Relevanter Kontext wird vor jedem Prompt injiziert – der Agent sucht nicht nach dem, was er braucht, er hat es einfach
Der Ansatz ist analog zum menschlichen Gedächtnis, bei dem Informationen automatisch auftauchen, anstatt explizite Abfragen zu erfordern.
Technische Implementierung
Alles läuft lokal mit SQLite auf Ihrem Rechner ohne Cloud-Abhängigkeiten und funktioniert offline. Derselbe Agentenspeicher bleibt über verschiedene Codierungstools hinweg bestehen. Die Einrichtung erfordert einen Installationsbefehl und dauert einige Minuten. Das Projekt ist unter der Apache-2.0-Lizenz lizenziert.
Zukünftige Entwicklung
Das Team arbeitet an einem benutzerspezifischen prädiktiven Gedächtnismodell, das Ihre Muster lernt und vorhersagt, welchen Kontext Sie benötigen, bevor Sie fragen. Dieses Modell wird lokal trainiert, wobei die Gewichte auf Ihrem Rechner bleiben.
📖 Read the full source: r/openclaw
👀 Siehe auch

Doc Harness: Eine Claude-Code-Fähigkeit zur Aufrechterhaltung des Projektzustands über Sitzungen hinweg
Doc Harness ist eine Claude Code-Fähigkeit, die ein leichtgewichtiges Dokumentationssystem mit fünf strukturierten Dateien erstellt, um KI-Agenten dabei zu helfen, den Projektkontext über Sitzungen hinweg aufrechtzuerhalten. Es behebt Probleme wie Kontextzurücksetzungen, vergessene Regeln und die Notwendigkeit, Projekte neuen Agenten erneut zu erklären.

AgentRoom: Desktop-App visualisiert KI-Codierungsagenten als Pixelcharaktere mit Sitzungssuche
AgentRoom ist eine Desktop-App, die Claude Code-, Codex- und Gemini-Sitzungen in animierte Pixel-Charaktere in einem virtuellen Büro verwandelt, mit Volltext-Semantiksuche über alle Sitzungen. Das Repo enthält eine eigenständige Claude Code-Skill zum Durchsuchen vergangener Sitzungen aus jeder Konversation.

Steelman R5: Feinabgestimmtes 14B-Modell übertrifft Claude Opus bei der Ada-Codegenerierung
Ein Entwickler hat Qwen2.5-Coder-14B-Instruct mithilfe von QLoRA auf einem kompilierverifizierten Datensatz von 3.430 Ada/SPARK-Instruktionspaaren feinabgestimmt und erreichte eine Kompilierungsrate von 68,6 % in einem benutzerdefinierten Benchmark im Vergleich zu Claude Opus 4.6 mit 42,1 %. Das Modell ist über Ollama verfügbar und benötigt 12 GB VRAM.

CLI-Anything-WEB: Open-Source-Plugin, das jede Website in ein Python-CLI für Claude Code zurückentwickelt
CLI-Anything-WEB ist ein Open-Source-Claude-Code-Plugin, das Ihren Browserverkehr überwacht, das Protokoll rückentwickelt und ein vollständiges Python-CLI mit Authentifizierung, Tests und --json-Unterstützung generiert. 19 Beispiel-CLIs für Seiten wie Reddit, Booking, Airbnb, ChatGPT und LinkedIn sind enthalten.