Galadriel: Arnés de caché cálido de código abierto para agentes persistentes de Claude

Un usuario de Reddit ha publicado como código abierto Galadriel, un arnés para agentes persistentes de Claude que logra un ahorro de costos del 87% y una latencia inferior a 3s en contextos de 100K tokens al optimizar el almacenamiento en caché de indicaciones. El proyecto, publicado bajo licencia MIT, aborda los problemas de memoria y costo a menudo llamados el "Problema del Pez Dorado" en agentes de codificación de IA.
Características clave
- Almacenamiento en caché apilado de 3 niveles: Puntos de ruptura de caché separados para definiciones de herramientas, indicaciones del sistema (
CLAUDE.md) e historial de conversación final. Esto evita la invalidación de caché en diferentes segmentos de contexto. - MemPalace integrado: Un sistema de memoria persistente basado en vectores que no rompe el caché de indicaciones, lo que permite un recuerdo permanente.
- Prioridad a la privacidad: Diseñado para subredes privadas: sin intermediarios, sin límites de mensajes, solo tu clave de API y reglas.
- Directrices CLAUDE.md (estilo Karpathy): Reglas integradas para evitar el aumento innecesario de contexto del agente.
Pruebas de rendimiento
Según el autor, probado contra flujos de trabajo de OpenClaw/Cursor:
- Costo: $10 por cada $100 gastados normalmente (reducción del 87%).
- Latencia: El contexto de 100K tokens pasa de 11s a <3s (mejora del 85%).
Para quién es
Desarrolladores que ejecutan agentes persistentes de Claude para tareas como gestión de infraestructura o mantenimiento de código base que están pagando altos costos de API debido a contexto no almacenado en caché.
Configuración
El arnés está actualmente personalizado para Discord (configuración personal del autor), pero la lógica de almacenamiento en caché es genérica. Clona el repositorio y adapta la capa de transporte según tus necesidades.
GitHub
github.com/avasol/galadriel-public (Licencia MIT)
📖 Lee la fuente completa: r/openclaw
👀 Ver también

CopilotKit: Componentes React de Código Abierto para Interfaces de Agente
CopilotKit (30k estrellas, MIT) proporciona componentes de React para la capa de interfaz de agente: chat, streaming, llamadas a herramientas, intervención humana y UI generativa, con soporte del protocolo AG-UI en LangGraph, ADK, CrewAI y más.

Open-Foundry: Un Marco para Debates Multi-Agente con Claude Code
Open-foundry es un framework de Python que ensambla múltiples agentes Claude Code en un panel para debatir preguntas complejas, produciendo rastros de razonamiento completamente inspeccionables con transcripciones, registros del orquestador y notas de trabajo por agente.

AGENTES-COLECCIÓN: 129 Agentes Claude Code Organizados en un Repositorio
Un desarrollador ha compilado 129 agentes de Claude Code en un solo repositorio en formato ~/.claude/agents/, listos para instalarse con un simple comando de copia. La colección incluye el sistema completo de agency-agents con 68 agentes impulsados por personalidad en múltiples disciplinas, además de agentes adicionales para flujos de trabajo de equipos multiagente.

La Técnica de Doble Búfer para Ventanas de Contexto de LLM Elimina la Compactación de Parada del Mundo
Una técnica llamada doble búfer puede evitar que los agentes de LLM se congelen durante la compactación de ventanas de contexto al resumir temprano y mantener dos búferes, permitiendo una transición fluida sin costo adicional de inferencia.