Lokales Speichersystem für KI-Codierungstools extrahiert über 2.600 Fakten aus Konversationsprotokollen

Ein Entwickler hat ein lokales Speichersystem für KI-Codierungstools erstellt, das vollständig auf seinem Rechner läuft und das Problem des erneuten Erklärens von Kontext in neuen Sitzungen löst. Das System arbeitet mit Claude Code, Factory.ai und Codex CLI und schreibt alle Konversationsprotokolle in eine einzige SQLite-Datenbank.
Funktionsweise
Das System verwendet mehrere automatisierte Prozesse:
- Ein Cron-Job läuft alle 15 Minuten, um Konversationsprotokolle in SQLite zu importieren
- Stündlich generiert es Vektoreinbettungen und extrahiert strukturierte Fakten mithilfe eines lokalen LLM (der Entwickler läuft Nemotron 3 Super auf einem DGX Spark über ollama)
- Jede neue Claude-Code-Sitzung beginnt mit einer automatisch über CLAUDE.md eingefügten memory-context.md-Datei
- Während der Sitzung kann Claude über MCP-Tools die gesamte Historie durchsuchen, einschließlich Stichwortsuche, semantischer Suche, Faktenabfrage und Entitätsgraphen-Exploration
Nutzungsstatistiken
Nach einigen Monaten normaler Nutzung:
- Über 13.000 Nachrichten in mehr als 400 Sitzungen indiziert
- Mehr als 2.600 extrahierte Fakten (Präferenzen, Entscheidungen, Fehler-/Lösungspaare, Tool-Muster)
- Über 330 verfolgte Entitäten (Bibliotheken, Dienste, Sprachen mit Erwähnungszählungen)
- 40 MB Datenbankgröße
Der Entitätsgraph verfolgt Nutzungsmuster wie "Sie haben pytest 45 Mal, playwright 20 Mal, jest 3 Mal verwendet" basierend auf tatsächlichen Nutzungsdaten.
Funktionen und Einschränkungen
Das System enthält eine browserbasierte Benutzeroberfläche zum Durchsuchen, Kuratieren von Fakten und Vorschau dessen, was in den Kontext eingefügt wird, sowie ein CLI-Tool und Slash-Befehle. Es ist nicht plug-and-play – Benutzer müssen Cron-Jobs einrichten, MCP konfigurieren und optional ollama ausführen. Der Entwickler merkt an, dass dies sein erstes Open-Source-Projekt ist und freut sich über Feedback zur Architektur, Faktenextraktionsmethode, MCP-Tool-Gestaltung und Verbesserungen der Python-/Projektstruktur.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

AIsbf 0.9.8 fügt Caching, Routing-Verbesserungen und erweiterte KI-Dienstunterstützung hinzu.
AIsbf 0.9.8 ist ein API-Proxy/Router, der eine OpenAI-kompatible Schnittstelle zu mehreren KI-Diensten bereitstellt. Diese Version fügt Redis-, SQLite-, MySQL- und dateibasiertes Caching hinzu, verbessertes semantisches Routing und volle OAuth2-Unterstützung für Claude.ai-, Amazon Kiro-cli-, OpenAI Codex- und Kilo.ai-Abonnenten.

LLM-Architektur-Galerie: Visuelle Referenz für Modellentwürfe
Sebastian Raschkas LLM-Architektur-Galerie sammelt Architekturdiagramme und Datenblätter aus The Big LLM Architecture Comparison und A Dream of Spring for Open-Weight LLMs, mit detaillierten Spezifikationen für Modelle wie Llama 3 8B, DeepSeek V3 und Gemma 3 27B.

Open-Source Web-UI für parallele Claude-Code-Sitzungen mit Git Worktree
Ein Entwickler hat eine Open-Source-Web-Oberfläche namens CCUI erstellt, die es ermöglicht, mehrere Claude Code-Sitzungen parallel mit git worktree auszuführen. Sie läuft als lokaler Webserver, der über einen Browser zugänglich ist, und unterstützt SSH-Portweiterleitung für die Remote-Entwicklung.

Claude Code unterstützt jetzt über 240 Modelle über das NVIDIA NIM Gateway – darunter Nemotron-3 120B für agentisches Programmieren
Claude Code kann während einer Sitzung über den Befehl /model auf über 240 NVIDIA NIM Modelle umschalten. Die Denkvariante von Nemotron-3 Super 120B zeigt starke Ergebnisse bei der Umstrukturierung mehrerer Dateien und agentischen Aufgaben.