Подход к самоулучшению памяти в локальных ИИ-агентах

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source

Архитектура памяти для постоянных ИИ-агентов

Разработчик на r/LocalLLaMA поделился своим подходом к созданию ИИ-агентов, которые не повторяют ошибки между сессиями. Основная решаемая проблема заключается в том, что каждая сессия начинается с нуля: контекстные окна сбрасываются, а исправления теряются между сессиями.

Реализация памяти

Система использует markdown в качестве источника истины вместо базы данных. MEMORY.md редактируется человеком — удалите строку в vim, и агент её забудет. SQLite и FAISS (HNSW, 768-мерный) являются производными кэшами, которые можно перестроить из markdown в любое время. Это позволяет пользователям контролировать версии памяти своего агента с помощью git.

Оценка эпизодов и обучение правилам

Каждое выполнение получает оценку +1/-1 и сохраняется как эпизод. При выполнении похожих задач в будущем соответствующие эпизоды попадают в контекст. Когда одна и та же сигнатура ошибки (SHA256 имени инструмента + нормализованная ошибка) появляется дважды в течение 7 дней, обучатель правил генерирует однострочное правило предотвращения.

Правила начинаются с уверенности 0.40 и требуют 0.60, чтобы фактически внедряться в будущие промпты. Успех повышает уверенность на +0.03, неудача снижает на -0.05. Правила, которые не помогают, со временем исчезают.

Система эскалации доверия

Вместо предварительной настройки уровней разрешений агент отслеживает паттерны одобрения. 5 одобрений с частотой 90%+ = автоматическое повышение. Один откат = понижение обратно. Существует режим теневого аудита.

Декомпозиция задач и безопасность

Сложные цели превращаются в DAG (ориентированный ациклический граф). Циклические зависимости обнаруживаются с помощью топологической сортировки, сбои каскадируются на зависимые задачи через DFS (поиск в глубину). Шлюз завершения проверяет 18 требований (R01-R18) — действительно ли агент читал файлы, вносил изменения, проверял результаты, оставался в рабочей области?

Функции безопасности включают 43 паттерна рисков bash, двухпроходный анализ (сырой + декодированный), отказоустойчивый дизайн (сбой Guardian = отказ) и минимальную глубину записи 3, чтобы предотвратить rm -rf /.

Разработчик ищет обратную связь по поводу того, правильно ли ощущается затухание уверенности в правилах и оптимальна ли асимметрия +0.03/-0.05. Также он интересуется, есть ли лучшие альтернативы HNSW для этого масштаба (обычно <10k эпизодов).

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Инструменты

Бета-версия Claude Dispatch: советы по настройке и первые впечатления

Разработчик делится опытом настройки бета-версии Dispatch на Mac Mini, подчеркивая необходимость постоянной работы, конкретных критериев успеха и агрессивных разрешений с включенным Computer Use.

2 мая 2026 г., 14:18 UTC

OpenClawRadar

Инструменты

AgentCall: Позвольте Claude Code участвовать в звонках Google Meet, Zoom или Teams в качестве коллеги

AgentCall.dev подключает ваш существующий сеанс Claude Code, Codex или Cursor к Google Meet, Teams или Zoom с голосом, демонстрацией экрана и чатом — без захвата рабочего стола, без передачи данных третьим лицам в прямом режиме.

24 апр. 2026 г., 02:15 UTC

OpenClawRadar

Инструменты

Graph Compose: Размещенные временные рабочие процессы с визуальным конструктором и искусственным интеллектом

Graph Compose — это хостинговая платформа для оркестрации API-воркфлоу на Temporal, позволяющая определять воркфлоу в виде JSON-графов с тремя методами построения: визуальный конструктор React Flow, TypeScript SDK и AI-ассистент, преобразующий обычный английский текст в графы.

21 апр. 2026 г., 20:25 UTC

OpenClawRadar

Инструменты

Выпущен OpenClaw Optimizer v1.18.0 с синхронизацией OpenClaw v2026.3.7.

Навык OpenClaw Optimizer версии 1.18.0 теперь совместим с OpenClaw v2026.3.7, добавив поддержку новых AI-провайдеров, включая Google Gemini 3.1 Flash-Lite и OpenAI gpt-5.4, а также новых CLI-команд, таких как /session idle и /usage cost.

9 мар. 2026 г., 23:45 UTC

OpenClawRadar