Galadriel: Open-Source Cache Harness für Claude Agenten

Ein Reddit-Nutzer hat Galadriel als Open-Source-Tool veröffentlicht, ein Framework für persistente Claude-Agenten, das durch optimiertes Prompt-Caching 87 % Kosteneinsparungen und eine Latenzzeit von unter 3s bei 100K-Token-Kontexten erzielt. Das unter MIT-Lizenz veröffentlichte Projekt zielt auf die Speicher- und Kostenprobleme ab, die oft als „Goldfischproblem“ bei KI-Coding-Agenten bezeichnet werden.

Hauptfunktionen

3-stufiges gestapeltes Caching: Separate Cache-Breakpoints für Tool-Definitionen, System-Prompts (CLAUDE.md) und den nachlaufenden Konversationsverlauf. Dies vermeidet Cache-Invalidierung über verschiedene Kontextsegmente hinweg.
Integriertes MemPalace: Ein vektorbasiertes persistentes Speichersystem, das den Prompt-Cache nicht bricht und dauerhaftes Abrufen ermöglicht.
Datenschutzorientiert: Entwickelt für private Subnetze – kein Mittelsmann, keine Nachrichtenlimits, nur Ihr API-Schlüssel und Regeln.
CLAUDE.md-Richtlinien (Karpathy-Stil): Integrierte Regeln, um eine Aufblähung des Agenten (unnötige Kontexterweiterung) zu verhindern.

Benchmarks

Laut Autor getestet gegen OpenClaw/Cursor-Workflows:

Kosten: 10 $ für je 100 $ normaler Ausgaben (87 % Reduzierung).
Latenz: 100K-Token-Kontext sinkt von 11s auf <3s (85 % Verbesserung).

Für wen es gedacht ist

Entwickler, die persistente Claude-Agenten für Aufgaben wie Infrastrukturverwaltung oder Codebase-Pflege betreiben und aufgrund ungecachten Kontexts hohe API-Kosten zahlen.

Einrichtung

Das Framework ist derzeit für Discord angepasst (das persönliche Setup des Autors), aber die Caching-Logik ist generisch. Klonen Sie das Repository und passen Sie die Transportschicht an Ihre Bedürfnisse an.