Обеспечение соответствия ИИ-агентов: Подходы на основе начальной загрузки языка и инструментов

Разработчик на r/openclaw обсуждает проблемы с соответствием ИИ-агентов и делится конкретными стратегиями, которые сработали для него.
Два первоначальных подхода
Источник определяет два фактора, влияющих на соответствие агента:
- Личность модели имеет значение: Соответствие значительно различается в зависимости от модели. Некоторые медлительны, некоторые упрямы, а некоторые «считают себя умнее вас». Эта личность напрямую влияет на поведение следования правилам.
- Негативный язык работает лучше: Использование
НЕТ,НЕ ДЕЛАЙиНИКОГДАв начальных инструкциях обычно закрепляется лучше, чем позитивные инструкции. Разработчик рекомендует «активно использовать» этот подход.
Ментальная модель: Учитель рисования vs. Учитель физики
Разработчик представляет концептуальную основу для понимания проблем соответствия:
- Модели ИИ = учителя рисования: Блестящие, творческие и ценные, но они «делают по-своему». Это описывается как одновременно и особенность, и недостаток современных ИИ-систем.
- Инструменты и код = учителя физики: Структурированные и ограниченные правилами. Учителя физики устанавливают правила, которые «нельзя нарушить — как гравитацию». Даже если учителю рисования не нравится гравитация, «она всё равно падает».
Практическое применение
Разработчик приводит реальный пример с плагином памяти, который исправляет «амнезию агента». Определённые отчёты «должны запускаться для удержания памяти и предотвращения её удаления», включая внутренние отчёты и пользовательские, такие как регулярный ночной отчёт о состоянии памяти.
Во время разработки «Учитель рисования» (модель ИИ) постоянно игнорировал форматы или данные, что приводило к нестабильной работе — иногда идеальной, иногда полностью отсутствующей. Причиной было то, что модель «игнорировала начальные правила».
Стратегия обеспечения соответствия
Разработчик описывает двухуровневый подход:
- Попытка Уровень 1: Использовать более сильные слова в начальных инструкциях (НЕТ/НИКОГДА и т.д.).
- Попытка Уровень 2: Когда мягкие правила в файлах
.mdне срабатывают, «использовать реальный код для принудительного соответствия». Это означает использование инструментов — Python, скриптов, жёсткой структуры. Разработчик отмечает, что «жёсткая структура побеждает вежливые инструкции каждый раз».
Текущий подход разработчика заключается в том, чтобы сначала решить, нуждается ли задача в «учителе рисования» (модель ИИ) или «учителе физики» (инструменты и код). Этот процесс принятия решений помогает в обеспечении соответствия и снижает стресс.
Краткое резюме
Соответствие зависит от силы языка начальных инструкций (НЕТ/НИКОГДА/и т.д.) и от того, какую модель вы используете. Когда эти мягкие правила не срабатывают, «перестаньте спрашивать учителя рисования и напишите учителя физики вместо этого — инструменты и код».
📖 Read the full source: r/openclaw
👀 Смотрите также

Четыре локальных файла для поддержания контекста Клода в длительных проектах
Пользователь Reddit рекомендует вести четыре файла Markdown — claude.md, memory.md, restart.md и backlog.md — в качестве внешней памяти для Claude, чтобы компенсировать сжатие контекстного окна в длинных беседах.

Claude Code лучше работает в качестве рецензента кода, чем генератора.
Разработчик делится, что Claude Code выдает более обоснованные результаты при использовании для проверки существующего кода, а не для генерации с нуля. Ключевые практики включают начало сессий с текущими реализациями, ведение файлов контекста проекта и перезапуск сессий при ухудшении ответов.

OpenClaw отлаживает ESP32+CC1101 на 433 МГц с помощью HackRF на Raspberry Pi 5
После неудачных попыток с прямым подключением GPIO и прошивкой ESP32, OpenClaw использовал HackRF для диагностики перепутанных выводов Tx/Rx на CC1101, в итоге добившись автономного захвата и воспроизведения сигналов на частоте 433 МГц на Pi 5.
Сократите токены стартап-агента на 60%: очистите рабочее пространство вашего бота
Один разработчик сократил начальные токены с 80k до 31k, поручив LLM провести аудит и реструктуризацию рабочих файлов — удаление избыточности, дедупликацию информации и организацию документации по инструментам в отдельные файлы.