Rückruf: Lokales Projektgedächtnis für Claude Code — Keine Token-Ausgabe für Zusammenfassungen

Recall ist ein vollständig lokales Projektgedächtnis-Plugin für Claude Code, das das Kaltstart-Problem löst, ohne Modell-Tokens für die Zusammenfassung zu verbrauchen. Es erfasst Sitzungstranskripte in .recall/history.md und verdichtet sie mit einem klassischen Python-Summarizer – kein LLM-Aufruf – zu einer kompakten context.md (~1–2K Tokens).
Wie es funktioniert
- Während einer Sitzung: Die
Stop- /SessionEnd-Hooks hängen neue Aktivitäten inkrementell an.recall/history.mdan – nur neue Schritte, vollständig lokal. - Zu Sitzungsbeginn: Der
SessionStart-Hook zeigtcontext.mdan und fordert Claude auf zu bestätigen: Vom gespeicherten Kontext fortsetzen? und Diese Sitzung weiter protokollieren?
Hauptvorteile
- Kein Token-Verbrauch für Speicher: Die Zusammenfassung erfolgt lokal durch einen deterministischen Algorithmus, nicht per API-Aufruf. Kein API-Schlüssel oder externes Modell erforderlich.
- Datenschutz: Transkripte (Code, Pfade, Geheimnisse) verlassen niemals Ihren Rechner. Die meisten Speicherwerkzeuge leiten Kontext an einen Modell-Endpunkt weiter; Recall nicht.
- Geringer Aufwand: Kein
pip install, kein lokales Modell zum Ausführen, kein Schlüssel zum Konfigurieren – funktioniert sofort offline nach dem Laden des Plugins.
Ausgabedateien
Zwei Dateien in .recall/:
history.md– ein reines Append-Protokoll mit Eingabeaufforderungen, Antworten, bearbeiteten Dateien, ausgeführten Befehlen.context.md– überschriebene Zusammenfassung mit: Ziel, Zusammenfassung, nächste Schritte/offene Themen, bearbeitete Dateien, wo Sie aufgehört haben.
Vergleich mit der integrierten Claude Code-Speicherfunktion
| Funktion | CLAUDE.md | --continue / --resume | Recall |
|---|---|---|---|
| Was | Handgeschriebene Notizen & Regeln | Lädt eine frühere Unterhaltung neu | Automatisch erfasstes Sitzungsprotokoll + lokale Zusammenfassung |
| Pflege | Manuell | Keine (Sie wählen Sitzung aus) | Keine – wird während der Arbeit geschrieben |
| Enthält | Anweisungen, die befolgt werden sollen | Vollständiges vorheriges Transkript | Ziel, Dateien, Befehle, wo Sie aufgehört haben, nächste Schritte |
| Kosten für Fortsetzung | Gering | Hoch (wiederholt vollständiges Transkript) | ~1–2K Tokens (kompakte Zusammenfassung) |
| Form | Markdown, das Sie bearbeiten | Lokaler Sitzungszustand | Klartext in .recall/ – diffbar & teilbar |
| Claude behandelt es als | Anweisungen | Die Unterhaltung | Eingeschlossene, nicht vertrauenswürdige Referenzdaten |
Kurz gesagt: CLAUDE.md ist wie ich möchte, dass du arbeitest; Recall ist hier ist, was wir letztes Mal gemacht haben und wo wir aufgehört haben – offline erstellt und verbraucht null Modell-Tokens.
📖 Vollständige Quelle lesen: HN LLM Tools
👀 Siehe auch

Exasol veröffentlicht MCP-Server für Datenbankkontext in KI-Agenten-Workflows
Exasol hat einen MCP-Server veröffentlicht, der Datenbanken ermöglicht, KI-Agenten Kontext über verfügbare Daten, Geschäftsregeln und sichere Interaktionsmethoden bereitzustellen. Der Server ist standardmäßig schreibgeschützt, unterstützt hochparallele Workflows und kann on-premise, in der Cloud oder in hybriden Umgebungen eingesetzt werden.

Entwickler erstellt praktische Claude-Fähigkeiten für Kotlin-Multiplattform-Projekte
Ein Entwickler hat ein öffentliches Repository von Claude-Fähigkeiten speziell für Kotlin Multiplatform-Arbeit erstellt, nachdem er feststellte, dass bestehende Fähigkeiten zu allgemein, zu stark auf einen bestimmten Stack fixiert oder zu oberflächlich waren. Die Fähigkeiten decken Architekturüberprüfungen, Feature-Implementierung, Modularisierung, Compose Multiplatform UI, Navigation, Plattformbrücken, Deep Links, adaptive Benutzeroberflächen, Tests und Build-Governance ab.

AgentCrawl-Update fügt wichtige Crawler-Funktionen und -Verbesserungen hinzu.
Die neueste Aktualisierung von AgentCrawl bringt Funktionen wie die Einhaltung von robots.txt, Disk-Cache, fortsetzbare Crawls und strukturierte Metadatenaus extraction mit sich, wodurch es zu einem robusteren, produktionsbereiten Tool wird.

Voxray-AI: Produktions-Backend in Go für Echtzeit-Sprachagenten-Pipelines
Voxray-AI ist ein Go-Backend, das Whisper → beliebiges LLM → TTS zu einer Echtzeit-Sprachagenten-Pipeline mit WebSocket- und WebRTC-Unterstützung verknüpft. Es ist für produktionsreife Server und hochgradig parallele Sprachworkloads mit konfigurierbaren Anbietern für STT-, LLM- und TTS-Schichten entwickelt.