Пользователь Reddit экспериментирует с агентами программирования, обучающимися на ошибках, чтобы прервать циклы повторных попыток.

✍️ OpenClawRadar📅 Опубликовано: 19 апреля 2026 г.🔗 Source
Пользователь Reddit экспериментирует с агентами программирования, обучающимися на ошибках, чтобы прервать циклы повторных попыток.
Ad

Разработчик на r/LocalLLaMA экспериментирует с кодирующими агентами, которые учатся на ошибках, чтобы выйти из повторяющихся циклов повторных попыток. Этот подход фокусируется на том, чтобы рассматривать неудачу как повторно используемую информацию, а не просто регистрировать сырые ошибки.

Проблема: Застревание в циклах неудач

Разработчик заметил, что кодирующие агенты часто застревают в шаблонах неудач: ошибка → повторная попытка → снова ошибка. Изначально считалось, что это ограничение модели, но проблема, по-видимому, заключается в обработке ошибок, когда системы не отслеживают, почему что-то пошло не так. При повторных попытках агенты обычно генерируют варианты той же попытки, повторяя те же ошибки немного разными способами.

Ad

Экспериментальный подход

Вместо хранения сырых логов разработчик начал сохранять упрощённые «корневые причины» и сопоставлять их с исправлениями, которые работали ранее. Будущие попытки затем сопоставляются с этими сохранёнными знаниями, а не угадываются заново. Разработчик отмечает, что этот подход всё ещё сырой, но демонстрирует иное поведение: система реже застревает в тех же циклах и иногда действительно находит решения.

Текущие проблемы

  • Надёжное сопоставление ошибок — сложная задача
  • Если система обобщает неверно, это может закрепить плохие исправления
  • Неясно, как балансировать между повторным использованием известных исправлений и поиском новых

Разработчик ищет мнение сообщества об этом подходе и о том, пробовали ли другие подобные методы для улучшения восстановления кодирующих агентов после ошибок.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Skales Desktop AI Agent, созданный с использованием Claude, с маскотом в стиле Клиппи
Инструменты

Skales Desktop AI Agent, созданный с использованием Claude, с маскотом в стиле Клиппи

Skales — это настольный ИИ-агент, работающий локально на Windows и macOS, использующий Claude через API OpenRouter/Anthropic для рассуждений и выполнения инструментов. Включает плавающий талисман Desktop Buddy со скином в виде скрепки и может выполнять команды, такие как отправка писем, управление файлами, просмотр веб-страниц и управление календарями.

OpenClawRadar
OnUI: Расширение для браузера для точной обратной связи по интерфейсу в Claude Code
Инструменты

OnUI: Расширение для браузера для точной обратной связи по интерфейсу в Claude Code

OnUI — это расширение для браузера, которое позволяет аннотировать элементы веб-страниц и экспортировать структурированные отчёты для Claude Code через локальный MCP, устраняя неоднозначные описания интерфейса. Разработанное в основном с помощью Claude Code, оно бесплатно, имеет открытый исходный код и доступно для Chrome, Edge и Firefox.

OpenClawRadar
Автоматический маршрутизатор против Sonnet: Экономия затрат против качества ответов
Инструменты

Автоматический маршрутизатор против Sonnet: Экономия затрат против качества ответов

Функция Auto Router от Open Router динамически выбирает языковые модели на основе сложности контекста, предлагая значительную экономию средств (0,8 цента против 0,00071 цента за запрос), но пользователи сообщают о снижении качества ответов по сравнению с Sonnet 4.6.

OpenClawRadar
Тесты MemAware Benchmark проверяют память ИИ за пределами поиска по ключевым словам.
Инструменты

Тесты MemAware Benchmark проверяют память ИИ за пределами поиска по ключевым словам.

MemAware — это бенчмарк с 900 вопросами по 3 уровням сложности, который проверяет, могут ли ИИ-ассистенты с памятью извлекать релевантный контекст, когда запросы не содержат на него намёков. Результаты показывают, что BM25-поиск набрал 2,8% против 0,8% без памяти, а векторный поиск падает до 0,7% на кросс-доменных связях.

OpenClawRadar