Пользователь Reddit экспериментирует с агентами программирования, обучающимися на ошибках, чтобы прервать циклы повторных попыток.

✍️ OpenClawRadar📅 Опубликовано: 19 апреля 2026 г.🔗 Source
Пользователь Reddit экспериментирует с агентами программирования, обучающимися на ошибках, чтобы прервать циклы повторных попыток.
Ad

Разработчик на r/LocalLLaMA экспериментирует с кодирующими агентами, которые учатся на ошибках, чтобы выйти из повторяющихся циклов повторных попыток. Этот подход фокусируется на том, чтобы рассматривать неудачу как повторно используемую информацию, а не просто регистрировать сырые ошибки.

Проблема: Застревание в циклах неудач

Разработчик заметил, что кодирующие агенты часто застревают в шаблонах неудач: ошибка → повторная попытка → снова ошибка. Изначально считалось, что это ограничение модели, но проблема, по-видимому, заключается в обработке ошибок, когда системы не отслеживают, почему что-то пошло не так. При повторных попытках агенты обычно генерируют варианты той же попытки, повторяя те же ошибки немного разными способами.

Ad

Экспериментальный подход

Вместо хранения сырых логов разработчик начал сохранять упрощённые «корневые причины» и сопоставлять их с исправлениями, которые работали ранее. Будущие попытки затем сопоставляются с этими сохранёнными знаниями, а не угадываются заново. Разработчик отмечает, что этот подход всё ещё сырой, но демонстрирует иное поведение: система реже застревает в тех же циклах и иногда действительно находит решения.

Текущие проблемы

  • Надёжное сопоставление ошибок — сложная задача
  • Если система обобщает неверно, это может закрепить плохие исправления
  • Неясно, как балансировать между повторным использованием известных исправлений и поиском новых

Разработчик ищет мнение сообщества об этом подходе и о том, пробовали ли другие подобные методы для улучшения восстановления кодирующих агентов после ошибок.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

OpenClaw против Hermes: Различные философии дизайна для ИИ-агентов
Инструменты

OpenClaw против Hermes: Различные философии дизайна для ИИ-агентов

OpenClaw — это многоканальный шлюз, соединяющий WhatsApp, Telegram, Discord, Slack и iMessage с обширной экосистемой навыков, в то время как Hermes — это обучающий агент, который оценивает задачи, сохраняет шаблоны в виде повторно используемых навыков и со временем строит модель вашего рабочего процесса.

OpenClawRadar
Проект встречи Qwen: Harness 2 для вызова функций повышает соответствие CoT с 9,91% до 100% с помощью структурированных схем
Инструменты

Проект встречи Qwen: Harness 2 для вызова функций повышает соответствие CoT с 9,91% до 100% с помощью структурированных схем

Продолжение предыдущего поста о функции вызова-привязки расширяет паттерн на домены без компилятора (инвестиционные меморандумы, юридические заключения, клинические карты). Схема принудительно требует заполнения полей — отправка отклоняется, если неполная. Qwen3.6-27b достигает 100% соответствия CoT на этих схемах.

OpenClawRadar
Исследование Руководства по Кодам Клода: Минималистский подход в 65 строках
Инструменты

Исследование Руководства по Кодам Клода: Минималистский подход в 65 строках

Расширение Claude Code охватывает основные принципы ИИ-кодирования всего в 65 строках Markdown, акцентируя внимание на 'Думай прежде, чем кодировать'. Несмотря на свою простоту, оно получило значительное признание среди разработчиков.

OpenClawRadar
Holaboss стремится решить проблему развертывания портативных локальных агентов.
Инструменты

Holaboss стремится решить проблему развертывания портативных локальных агентов.

Holaboss — это проект с открытым исходным кодом, который рассматривает AI-работника как переносимый артефакт с индивидуальным рабочим пространством для каждого работника, локальными навыками/приложениями, постоянной памятью и средой выполнения, которую можно упаковать отдельно от десктопного приложения. Он поддерживает локальные стеки моделей, такие как Ollama, и требует Node.js 22+ на целевых машинах.

OpenClawRadar