Хорошая разработка с помощью ИИ происходит на уровне систем, а не задач

Пост на Reddit от пользователя u/johns10davenport утверждает, что настоящий рычаг в разработке с помощью ИИ — это изменение системы, а не улучшение промптов. Автор описывает знакомую проблему: каждый раз при добавлении новой функции в своё приложение Phoenix AI-агент реализует фичу, но пропускает пункт меню. Страница существует, функциональность работает, но у пользователя нет способа туда попасть.
Проблема исправлений на уровне задач
Первая реакция — сказать модели: «добавь кнопку». Это работает, но человек всё ещё думает — выявляет проблему и указывает способ её исправления. Автор называет это «крутить педали Peloton, чтобы Anthropic давал мне бесплатные токены». Инженерия промптов просто делает вас лучше в подсказках модели, но вы всё ещё работаете на модель.
Системный сдвиг
Вместо того чтобы исправлять отсутствующую кнопку, автор спросил: как сделать так, чтобы эта ошибка стала невозможна в будущем? Их решение использует BDD-спецификации и тестовые хелперы Phoenix LiveView. Функция navigate тестового фреймворка позволяет агенту переходить напрямую на любую страницу, проходя тесты без взаимодействия с UI. Поэтому они написали правило линтера, запрещающее агенту вызывать navigate. Теперь есть разрешённый фикстур, который помещает тест на известный стартовый маршрут, и единственный способ для агента достичь новой функции — щёлкать по UI, что заставляет его добавить пункт меню для прохождения теста.
Результат: проблема никогда не повторится, не благодаря лучшему промпту, а потому что корректное поведение — это единственно возможное поведение.
Ключевой вывод
Перестаньте исправлять вывод модели. Начните ограничивать её среду так, чтобы правильный вывод был путём наименьшего сопротивления. Каждая ошибка — это шанс спроектировать следующую ошибку.
📖 Источник: r/ClaudeAI
👀 Смотрите также

ИИ написал 100 тысяч строк на Rust: контракты, спецификация и производительность
Чэн Хуан создал движок Multi-Paxos на Rust с помощью AI-агентов, достигнув производительности 300K операций в секунду. Ключевые техники: AI-написанные контракты кода, облегченная разработка на основе спецификаций и агрессивная оптимизация.

Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели
Пользователь отслеживал использование токенов в течение 14 дней и обнаружил, что 67% расходов приходилось на задачи, где дешевые модели Flash соответствовали качеству Opus. Переход на Flash по умолчанию и использование /model во время сессии сократили расходы с ~$170 до ~$35 в месяц.

Команда Claude /btw позволяет вести параллельное общение во время выполнения задач.
Claude AI теперь поддерживает команду /btw, которая позволяет пользователям общаться с ИИ, пока он активно выполняет задачу, позволяя задавать вопросы, давать дополнительные инструкции или уточнения, не прерывая текущий рабочий процесс.

Маршрутизация подзадач агента к более дешевым моделям снизила стоимость с $18 до $4 при том же рефакторинге
Разработчик снизил стоимость запуска агента с 18 до 4 долларов, направив рутинные подзадачи (линтер, переименование, правки конфигов) на дешевые модели вроде DeepSeek V4 Pro и Tencent Hunyuan Hy3, оставив Opus 4.7 для сложных рассуждений.