Ограничения для AI-агентов: 0 сломанных сборок при удалении 140 файлов

От хрупких промптов к протоколам выполнения

Пользователь Reddit поделился подробной методикой перехода от одноразовых промптов с Claude к созданию надежных, производственных систем. Подход сосредоточен на проектировании ограничений, а не на написании инструкций, что продемонстрировано безопасным удалением примерно 140 файлов из рабочей кодовой базы с нулевым количеством сломанных сборок и полной проверкой.

Ключевые компоненты проектирования ограничений

Система состоит из нескольких критически важных элементов, которые превращают промпты в протоколы выполнения:

Точное определение роли

Определите поведение, границы и то, что явно выходит за рамки
Избегайте расплывчатых утверждений, таких как «будь экспертом»
Без этого модель будет заполнять пробелы и импровизировать

Перечисление режимов сбоев

Спросите: «Как вы потерпите неудачу в этой задаче?»
Выявите риски, включая: неправильные удаления, нарушенные цепочки зависимостей, пропущенные шаги, тихие сбои и расширение объема
Если риски не явные, они не смягчаются

Меры смягчения для каждого режима сбоя

Прикрепляйте явные правила, а не предложения
Примеры включают: «никаких оценочных суждений» (действуйте только по явным спискам), «проверяйте после каждого шага» (тесты, проверки или эквиваленты), «останавливайтесь при сбое» (без продолжения), «выводите результаты для каждой команды»
Если у режима сбоя нет контроля, он произойдет

Поэтапное выполнение с контрольными точками

Предварительная проверка (исходное состояние)
Пошаговое выполнение с проверкой
Высокорисковые шаги изолированы
Финальная валидация (тесты, сборка, сканирование)
Длительные задачи требуют проверки состояния, иначе модель отклоняется

Правила против сокращений

Без рефакторинга
Без «улучшений»
Без касания неуказанных файлов
Без пропуска шагов проверки
Без продолжения после сбоя

Основные причины сбоев

В посте определены общие модели сбоев при использовании ИИ-агентов:

Слишком много неявного поведения
Нет явного осознания сбоев
Нет принудительной валидации
Нет жестких границ

Практические рекомендации

Автор дает эмпирическое правило для задач с реальными последствиями:

Нет определения роли → отклонение
Нет режимов сбоев → слепые зоны
Нет защитных мер → галлюцинации
Нет контрольных точек → потеря состояния

Этот подход отличает системы, которые «работают большую часть времени», от тех, которые «достаточно надежны, чтобы доверять им в реальной системе». Автор подчеркивает, что одноразовые промпты для сложных задач оставляют большую часть возможностей неиспользованной.

📖 Read the full source: r/ClaudeAI