Подход к самоулучшению памяти в локальных ИИ-агентах

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Подход к самоулучшению памяти в локальных ИИ-агентах
Ad

Архитектура памяти для постоянных ИИ-агентов

Разработчик на r/LocalLLaMA поделился своим подходом к созданию ИИ-агентов, которые не повторяют ошибки между сессиями. Основная решаемая проблема заключается в том, что каждая сессия начинается с нуля: контекстные окна сбрасываются, а исправления теряются между сессиями.

Реализация памяти

Система использует markdown в качестве источника истины вместо базы данных. MEMORY.md редактируется человеком — удалите строку в vim, и агент её забудет. SQLite и FAISS (HNSW, 768-мерный) являются производными кэшами, которые можно перестроить из markdown в любое время. Это позволяет пользователям контролировать версии памяти своего агента с помощью git.

Оценка эпизодов и обучение правилам

Каждое выполнение получает оценку +1/-1 и сохраняется как эпизод. При выполнении похожих задач в будущем соответствующие эпизоды попадают в контекст. Когда одна и та же сигнатура ошибки (SHA256 имени инструмента + нормализованная ошибка) появляется дважды в течение 7 дней, обучатель правил генерирует однострочное правило предотвращения.

Правила начинаются с уверенности 0.40 и требуют 0.60, чтобы фактически внедряться в будущие промпты. Успех повышает уверенность на +0.03, неудача снижает на -0.05. Правила, которые не помогают, со временем исчезают.

Ad

Система эскалации доверия

Вместо предварительной настройки уровней разрешений агент отслеживает паттерны одобрения. 5 одобрений с частотой 90%+ = автоматическое повышение. Один откат = понижение обратно. Существует режим теневого аудита.

Декомпозиция задач и безопасность

Сложные цели превращаются в DAG (ориентированный ациклический граф). Циклические зависимости обнаруживаются с помощью топологической сортировки, сбои каскадируются на зависимые задачи через DFS (поиск в глубину). Шлюз завершения проверяет 18 требований (R01-R18) — действительно ли агент читал файлы, вносил изменения, проверял результаты, оставался в рабочей области?

Функции безопасности включают 43 паттерна рисков bash, двухпроходный анализ (сырой + декодированный), отказоустойчивый дизайн (сбой Guardian = отказ) и минимальную глубину записи 3, чтобы предотвратить rm -rf /.

Разработчик ищет обратную связь по поводу того, правильно ли ощущается затухание уверенности в правилах и оптимальна ли асимметрия +0.03/-0.05. Также он интересуется, есть ли лучшие альтернативы HNSW для этого масштаба (обычно <10k эпизодов).

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Навык Claude Code /council запускает промты параллельно на 4 моделях ИИ
Инструменты

Навык Claude Code /council запускает промты параллельно на 4 моделях ИИ

Навык Claude Code под названием /council отправляет любой запрос одновременно в GPT, Claude, Gemini и Grok примерно за 7 секунд, а затем использует Gemini для синтеза лучшего ответа, выявляя конкретные улучшения от других моделей.

OpenClawRadar
Ktx: Исполняемый контекстный слой для исправления точности агентов данных
Инструменты

Ktx: Исполняемый контекстный слой для исправления точности агентов данных

Ktx — это открытая исполняемая контекстная прослойка, которая делает агентов надежными в вашем стеке данных, объединяя импорт вики из Markdown с семантическими определениями на YAML.

OpenClawRadar
OnUI: Расширение для браузера для точной обратной связи по интерфейсу в Claude Code
Инструменты

OnUI: Расширение для браузера для точной обратной связи по интерфейсу в Claude Code

OnUI — это расширение для браузера, которое позволяет аннотировать элементы веб-страниц и экспортировать структурированные отчёты для Claude Code через локальный MCP, устраняя неоднозначные описания интерфейса. Разработанное в основном с помощью Claude Code, оно бесплатно, имеет открытый исходный код и доступно для Chrome, Edge и Firefox.

OpenClawRadar
LoreConvo: Сервер MCP добавляет постоянную память сессий в код Claude
Инструменты

LoreConvo: Сервер MCP добавляет постоянную память сессий в код Claude

LoreConvo — это MCP-сервер, который предоставляет Claude Code постоянную память сессий, автоматически сохраняя и загружая контекст между сессиями. Он экономит 3 000–8 000 токенов за сессию, устраняя накладные расходы на повторное контекстуализирование.

OpenClawRadar