Результаты тестирования: система агентов Claude с памятью демонстрирует экономию токенов на 30-43%

✍️ OpenClawRadar📅 Опубликовано: 8 марта 2026 г.🔗 Source
Результаты тестирования: система агентов Claude с памятью демонстрирует экономию токенов на 30-43%
Ad

Тестирование системы памяти для роёв агентов Claude

Разработчик девять месяцев создавал систему памяти под названием Stompy, эволюционировавшую от файловой базы к SQLite и затем к PostgreSQL. Целью было минимизировать использование токенов при работе роёв агентов Claude. Они провели сравнительный тест производительности с системой памяти и без неё.

Настройка теста

В тесте использовалась задача по кодированию из 40 пунктов, требующая реализации полной функции бронирования с бэкендом, фронтендом и тестами. Рой из 6 агентов тестировался с тремя разными моделями Claude в качестве ведущего: Sonnet 4.6, Opus 4.6 и Haiku 4.5. Все тесты использовали одну и ту же кодовую базу, одних и тех же агентов-компаньонов и одинаковую систему оценки. Агенты-компаньоны всегда работали на Opus независимо от ведущей модели.

Результаты тестирования

  • Sonnet 4.6 + память: 40/40, $3.98, 6.5 мин, 2 подхода
  • Sonnet 4.6 без памяти: 40/40, $7.04, 9.6 мин, 4 подхода
  • Opus 4.6 + память: 40/40, $4.34, 9.6 мин, 29 подходов
  • Opus 4.6 без памяти: 40/40, $7.65, 10.0 мин, 70 подходов
  • Haiku 4.5 + память: 39/40, $4.95, 7.5 мин, 2 подхода
  • Haiku 4.5 без памяти: 0/40, $3.97, 5.8 мин, 3 подхода
Ad

Ключевые выводы

Opus и Sonnet с памятью позволили сэкономить около 43% стоимости по сравнению с работой без памяти. Разработчик отмечает, что эти модели достаточно умны, чтобы выполнить задачу без памяти, но они тратят токены на изучение кодовой базы, чего система памяти позволяет избежать.

Результат Haiku оказался неожиданным: он набрал 0/40 без памяти, но 39/40 с памятью. Разработчик заметил, что Haiku не мог координировать агентов-компаньонов Opus без понимания структуры проекта, но стал компетентным ведущим при доступе к памяти.

Sonnet с памятью оказался лучшей общей конфигурацией, превзойдя Opus без памяти по всем показателям примерно при вдвое меньшей стоимости. Главный вывод заключается в том, что предоставление модели знаний о проекте важнее, чем использование дорогих моделей.

Технические детали

Система памяти называется Stompy и основана на MCP/API/CLI, работая с Claude Code. Настройка теста доступна на GitHub для использования или улучшения другими. Разработчик отмечает, что пока это n=1 на условие, планируется больше запусков.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Membase: Внешний слой памяти для ИИ-ассистентов в различных инструментах
Инструменты

Membase: Внешний слой памяти для ИИ-ассистентов в различных инструментах

Membase — это внешний слой памяти, который извлекает и сохраняет контекст разговора в графе знаний, а затем внедряет соответствующие воспоминания в новые чаты в Claude, ChatGPT, Cursor, Gemini и других ИИ-инструментах. В настоящее время находится в закрытой бета-версии, все функции бесплатны.

OpenClawRadar
Библиотека промптов для ИИ-агентов с открытым исходным кодом достигла 100 звёзд на GitHub
Инструменты

Библиотека промптов для ИИ-агентов с открытым исходным кодом достигла 100 звёзд на GitHub

Общедоступный репозиторий под названием ai-setup предоставляет общие системные промпты, правила Cursor, конфигурации Claude и настройки рабочих процессов для локальных моделей AI-агентов. Проект имеет 100 звёзд на GitHub и 90 принятых PR.

OpenClawRadar
Ресурсная лодка: искусственный интелект с открытым исходным кодом и памятью на основе графа знаний
Инструменты

Ресурсная лодка: искусственный интелект с открытым исходным кодом и памятью на основе графа знаний

Rowboat — это открытое приложение с открытым исходным кодом, которое превращает вашу работу в живую графовую базу знаний, храня данные локально в формате Markdown и предлагая локальную помощь на основе ИИ.

OpenClawRadar
Файл протокола Claude Code сокращает количество повторяющихся вопросов.
Инструменты

Файл протокола Claude Code сокращает количество повторяющихся вопросов.

Разработчик создал один файл .md для каталога ~/.claude/rules/, который определяет тип задачи и уровень риска по первому сообщению, устраняя типичную для Claude Code последовательность из трёх вопросов перед началом работы.

OpenClawRadar