Galadriel: Open-Source Warm-Cache-Harness für persistente Claude-Agenten

Ein Reddit-Nutzer hat Galadriel als Open-Source-Tool veröffentlicht, ein Framework für persistente Claude-Agenten, das durch optimiertes Prompt-Caching 87 % Kosteneinsparungen und eine Latenzzeit von unter 3s bei 100K-Token-Kontexten erzielt. Das unter MIT-Lizenz veröffentlichte Projekt zielt auf die Speicher- und Kostenprobleme ab, die oft als „Goldfischproblem“ bei KI-Coding-Agenten bezeichnet werden.
Hauptfunktionen
- 3-stufiges gestapeltes Caching: Separate Cache-Breakpoints für Tool-Definitionen, System-Prompts (
CLAUDE.md) und den nachlaufenden Konversationsverlauf. Dies vermeidet Cache-Invalidierung über verschiedene Kontextsegmente hinweg. - Integriertes MemPalace: Ein vektorbasiertes persistentes Speichersystem, das den Prompt-Cache nicht bricht und dauerhaftes Abrufen ermöglicht.
- Datenschutzorientiert: Entwickelt für private Subnetze – kein Mittelsmann, keine Nachrichtenlimits, nur Ihr API-Schlüssel und Regeln.
- CLAUDE.md-Richtlinien (Karpathy-Stil): Integrierte Regeln, um eine Aufblähung des Agenten (unnötige Kontexterweiterung) zu verhindern.
Benchmarks
Laut Autor getestet gegen OpenClaw/Cursor-Workflows:
- Kosten: 10 $ für je 100 $ normaler Ausgaben (87 % Reduzierung).
- Latenz: 100K-Token-Kontext sinkt von 11s auf <3s (85 % Verbesserung).
Für wen es gedacht ist
Entwickler, die persistente Claude-Agenten für Aufgaben wie Infrastrukturverwaltung oder Codebase-Pflege betreiben und aufgrund ungecachten Kontexts hohe API-Kosten zahlen.
Einrichtung
Das Framework ist derzeit für Discord angepasst (das persönliche Setup des Autors), aber die Caching-Logik ist generisch. Klonen Sie das Repository und passen Sie die Transportschicht an Ihre Bedürfnisse an.
GitHub
github.com/avasol/galadriel-public (MIT-Lizenz)
📖 Vollständige Quelle lesen: r/openclaw
👀 Siehe auch

memora: versionskontrollierter, typisierter Speicher für KI-Agenten – Git für KI-Überzeugungen
memora ist ein CLI-Tool in Rust, das KI-Agentenspeicher versioniert – typisiert, mit Herkunftsnachweis, verzweigbar und zusammenführbar.

vllm-mlx-Fork fügt Tool-Calling und Prompt-Cache für lokale KI-Codierungsagenten hinzu
Ein Entwickler hat vllm-mlx modifiziert, um Probleme bei Tool-Aufrufen zu beheben und Prompt-Caching hinzuzufügen, wodurch die TTFT für OpenClaw auf Apple Silicon von 28s auf 0,3s reduziert wurde. Der Fork unterstützt Qwen3-Coder-Next mit 65 Tok/s auf dem M3 Ultra mit funktionierendem Funktionsaufruf.

Claude IDE Bridge: WebSocket-Tool für Echtzeit-IDE-Zugriff
claude-ide-bridge ist eine WebSocket-Brücke, die Claude Code direkt mit dem internen Zustand der IDE verbindet und so Live-Diagnosen, Gehe-zur-Definition, Referenzsuche, Typ-Hovering, Dateiöffnung, Breakpoint-Verwaltung und Debugger-Zustandsstreaming ermöglicht.

Puzzle-Spiel für Bots mit Preisen: Eine neue Herausforderung für KI-Programmierer
Ein faszinierendes neues Puzzle-Spiel lädt KI-Programmierer dazu ein, ihre Kreativität und Intelligenz auszuleben, indem sie Bot-Lösungen entwickeln, um Preise zu gewinnen. Die Initiative hat in der KI-Community für Aufsehen gesorgt und Kreativität sowie Wettbewerb angeregt.