Galadriel: Открытый инструмент для поддержания "теплого" кэша для постоянных агентов Claude

Пользователь Reddit опубликовал с открытым исходным кодом Galadriel — обвязку для постоянных агентов Claude, которая обеспечивает 87% экономии средств и задержку менее 3 секунд для контекста из 100K токенов за счет оптимизации кэширования подсказок. Проект, выпущенный под лицензией MIT, решает проблемы памяти и стоимости, часто называемые «Проблемой золотой рыбки» в AI-агентах для кодирования.
Ключевые особенности
- 3-уровневое кэширование: Отдельные точки разрыва кэша для определений инструментов, системных подсказок (
CLAUDE.md) и последней истории диалога. Это предотвращает инвалидацию кэша между разными сегментами контекста. - Встроенный MemPalace: Векторная система постоянной памяти, не нарушающая кэш подсказок, обеспечивающая постоянное запоминание.
- Конфиденциальность в приоритете: Разработано для частных подсетей — никаких посредников, никаких лимитов сообщений, только ваш API-ключ и правила.
- Руководства CLAUDE.md (в стиле Карпати): Встроенные правила для предотвращения раздувания агента (ненужного расширения контекста).
Бенчмарки
По словам автора, протестировано в сравнении с рабочими процессами OpenClaw/Cursor:
- Стоимость: $10 за каждые $100, которые обычно тратятся (снижение на 87%).
- Задержка: Контекст из 100K токенов снижается с 11 с до <3 с (улучшение на 85%).
Для кого это
Разработчики, запускающие постоянных агентов Claude для задач вроде управления инфраструктурой или обслуживания кодовой базы, которые платят высокие расходы на API из-за некэшированного контекста.
Установка
В настоящее время обвязка настроена для Discord (личная установка автора), но логика кэширования универсальна. Склонируйте репозиторий и адаптируйте транспортный уровень под свои нужды.
GitHub
github.com/avasol/galadriel-public (лицензия MIT)
📖 Читать полный источник: r/openclaw
👀 Смотрите также

GoModel: Легковесный шлюз искусственного интеллекта с открытым исходным кодом, написанный на Go
GoModel — это открытый шлюз искусственного интеллекта, который предоставляет унифицированный API, совместимый с OpenAI, для множества провайдеров, включая OpenAI, Anthropic, Gemini, Groq, xAI и Ollama. Он отличается образом Docker размером 17 МБ, что в 44 раза меньше, чем у LiteLLM, с конфигурацией на основе переменных окружения и встроенной наблюдаемостью.

ClawWatcher достиг отметки в 200 пользователей, сообщив о совокупной экономии более $28K на API OpenClaw.
ClawWatcher, инструмент для отслеживания затрат на API OpenClaw в реальном времени, достиг 200 пользователей. По словам его создателя, пользователи в совокупности сэкономили более 28 000 долларов на затратах на API, со средним снижением расходов на 45%.

Реестр AbsolutelySkilled пополнился 156 готовыми к использованию навыками для Claude Code.
Разработчик создал AbsolutelySkilled — реестр из 156 структурированных модулей навыков для Claude Code, которые сохраняются между сессиями. Каждый навык включает условия запуска, справочные файлы, тестовые случаи и антипаттерны в файлах SKILL.md.

AI Token Monitor: Инструмент для macOS отслеживает локальное использование Claude и расходы
Разработчик создал AI Token Monitor — приложение для строки меню macOS, которое читает локальные файлы сессий Claude для отслеживания использования токенов, распределения моделей и эквивалентов стоимости без API-ключей. Инструмент с открытым исходным кодом показал 6,5 млн токенов (4 924 доллара по ценам API) за 35 дней в случае одного пользователя.