Galadriel: Arnés Caché 3 Niveles para Claude, Reduce Costos 87%

Un usuario de Reddit ha publicado como código abierto Galadriel, un arnés para agentes persistentes de Claude que logra un ahorro de costos del 87% y una latencia inferior a 3s en contextos de 100K tokens al optimizar el almacenamiento en caché de indicaciones. El proyecto, publicado bajo licencia MIT, aborda los problemas de memoria y costo a menudo llamados el "Problema del Pez Dorado" en agentes de codificación de IA.

Características clave

Almacenamiento en caché apilado de 3 niveles: Puntos de ruptura de caché separados para definiciones de herramientas, indicaciones del sistema (CLAUDE.md) e historial de conversación final. Esto evita la invalidación de caché en diferentes segmentos de contexto.
MemPalace integrado: Un sistema de memoria persistente basado en vectores que no rompe el caché de indicaciones, lo que permite un recuerdo permanente.
Prioridad a la privacidad: Diseñado para subredes privadas: sin intermediarios, sin límites de mensajes, solo tu clave de API y reglas.
Directrices CLAUDE.md (estilo Karpathy): Reglas integradas para evitar el aumento innecesario de contexto del agente.

Pruebas de rendimiento

Según el autor, probado contra flujos de trabajo de OpenClaw/Cursor:

Costo: $10 por cada $100 gastados normalmente (reducción del 87%).
Latencia: El contexto de 100K tokens pasa de 11s a <3s (mejora del 85%).

Para quién es

Desarrolladores que ejecutan agentes persistentes de Claude para tareas como gestión de infraestructura o mantenimiento de código base que están pagando altos costos de API debido a contexto no almacenado en caché.

Configuración

El arnés está actualmente personalizado para Discord (configuración personal del autor), pero la lógica de almacenamiento en caché es genérica. Clona el repositorio y adapta la capa de transporte según tus necesidades.