Хорошая разработка с помощью ИИ происходит на уровне систем, а не задач

✍️ OpenClawRadar📅 Опубликовано: 20 мая 2026 г.🔗 Source
Хорошая разработка с помощью ИИ происходит на уровне систем, а не задач
Ad

Пост на Reddit от пользователя u/johns10davenport утверждает, что настоящий рычаг в разработке с помощью ИИ — это изменение системы, а не улучшение промптов. Автор описывает знакомую проблему: каждый раз при добавлении новой функции в своё приложение Phoenix AI-агент реализует фичу, но пропускает пункт меню. Страница существует, функциональность работает, но у пользователя нет способа туда попасть.

Проблема исправлений на уровне задач

Первая реакция — сказать модели: «добавь кнопку». Это работает, но человек всё ещё думает — выявляет проблему и указывает способ её исправления. Автор называет это «крутить педали Peloton, чтобы Anthropic давал мне бесплатные токены». Инженерия промптов просто делает вас лучше в подсказках модели, но вы всё ещё работаете на модель.

Ad

Системный сдвиг

Вместо того чтобы исправлять отсутствующую кнопку, автор спросил: как сделать так, чтобы эта ошибка стала невозможна в будущем? Их решение использует BDD-спецификации и тестовые хелперы Phoenix LiveView. Функция navigate тестового фреймворка позволяет агенту переходить напрямую на любую страницу, проходя тесты без взаимодействия с UI. Поэтому они написали правило линтера, запрещающее агенту вызывать navigate. Теперь есть разрешённый фикстур, который помещает тест на известный стартовый маршрут, и единственный способ для агента достичь новой функции — щёлкать по UI, что заставляет его добавить пункт меню для прохождения теста.

Результат: проблема никогда не повторится, не благодаря лучшему промпту, а потому что корректное поведение — это единственно возможное поведение.

Ключевой вывод

Перестаньте исправлять вывод модели. Начните ограничивать её среду так, чтобы правильный вывод был путём наименьшего сопротивления. Каждая ошибка — это шанс спроектировать следующую ошибку.

📖 Источник: r/ClaudeAI

Ad

👀 Смотрите также

ИИ написал 100 тысяч строк на Rust: контракты, спецификация и производительность
Советы

ИИ написал 100 тысяч строк на Rust: контракты, спецификация и производительность

Чэн Хуан создал движок Multi-Paxos на Rust с помощью AI-агентов, достигнув производительности 300K операций в секунду. Ключевые техники: AI-написанные контракты кода, облегченная разработка на основе спецификаций и агрессивная оптимизация.

OpenClawRadar
Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели
Советы

Как сократить расходы на OpenClaw Agent на 80% с помощью смены модели

Пользователь отслеживал использование токенов в течение 14 дней и обнаружил, что 67% расходов приходилось на задачи, где дешевые модели Flash соответствовали качеству Opus. Переход на Flash по умолчанию и использование /model во время сессии сократили расходы с ~$170 до ~$35 в месяц.

OpenClawRadar
Команда Claude /btw позволяет вести параллельное общение во время выполнения задач.
Советы

Команда Claude /btw позволяет вести параллельное общение во время выполнения задач.

Claude AI теперь поддерживает команду /btw, которая позволяет пользователям общаться с ИИ, пока он активно выполняет задачу, позволяя задавать вопросы, давать дополнительные инструкции или уточнения, не прерывая текущий рабочий процесс.

OpenClawRadar
Маршрутизация подзадач агента к более дешевым моделям снизила стоимость с $18 до $4 при том же рефакторинге
Советы

Маршрутизация подзадач агента к более дешевым моделям снизила стоимость с $18 до $4 при том же рефакторинге

Разработчик снизил стоимость запуска агента с 18 до 4 долларов, направив рутинные подзадачи (линтер, переименование, правки конфигов) на дешевые модели вроде DeepSeek V4 Pro и Tencent Hunyuan Hy3, оставив Opus 4.7 для сложных рассуждений.

OpenClawRadar