agentcache: 76% Кэш-Хитов в LLM

agentcache — это библиотека Python, разработанная для оптимизации многозадачных LLM-систем за счёт реализации кэширования префиксов как основной функции. Библиотека решает распространённую проблему, когда фреймворки, такие как CrewAI, AutoGen и open-multi-agent, создают новые сессии для каждого работника, что приводит к нулевому попаданию в кэш и дублированию затрат на промпты.

Как это работает

Библиотека работает на основе подхода с ветвлением вместо создания отдельных сессий:

Запустите одну сессию с общим системным промптом
Сделайте первый вызов — провайдер вычисляет и кэширует префикс
Когда вам нужно N работников, выполните ветвление вместо создания N новых сессий
Родительская сессия: [система, сообщение1, сообщение2, ...]
Ветвлённая сессия: [система, сообщение1, сообщение2, ..., ЗАДАЧА_РАБОТНИКА]
Тот же самый префикс = попадание в кэш

Ключевые особенности

Кэш-безопасное ветвление: Сохраняет идентичные префиксы в сессиях работников
Обнаружение сброса кэша: Сравнивает снимки и точно сообщает, что изменилось при падении попаданий в кэш
Кэш-безопасное сжатие: Для длительных сессий сканирует старые результаты инструментов перед каждым вызовом и заменяет большие результаты детерминированными заполнителями, чтобы сохранить меньший контекст при поддержании кэшируемых префиксов
Замораживание параметров: Замораживает параметры, влияющие на кэш, перед ветвлением (системный промпт, модель, инструменты, сообщения, конфигурация рассуждений)
Планирование графа задач: Позволяет параллельным работникам работать из одной кэшированной сессии

Результаты производительности

В прямом тесте с GPT-4o-mini (координатор + 3 работника, одна задача):

Внедрение текста / отдельные сессии: 0% попаданий в кэш, 85,7 секунд
Ветвление префиксов: 75,8% попаданий в кэш, 37,4 секунды
Уровень попаданий в кэш на работника обычно составляет 80-99%

Установка и использование

Установите через pip:

pip install "git+https://github.com/masteragentcoder/agentcache.git@main"

Библиотека доступна на GitHub по адресу github.com/masteragentcoder/agentcache.

📖 Read the full source: r/LocalLLaMA

agentcache: Библиотека Python для кэширования префиксов в мультиагентных LLM

Как это работает

Ключевые особенности

Результаты производительности

Установка и использование

👀 Смотрите также

Управление контекстом ИИ с помощью хранилища знаний SQLite и инструментов MCP

Инструмент чтения Claude Code незаметно уменьшает изображения, вызывая галлюцинации

Офлайн-инструмент преобразования речи в текст для macOS с использованием локальной модели Whisper через MLX

Sgai: Инструмент для разработки программного обеспечения с несколькими агентами, ориентированный на цели