Когда использовать AI-агентов против более простых инструментов: паттерны из r/LocalLLaMA

Обсуждение на r/LocalLLaMA рассматривает, когда использовать AI-агентов, а когда более простые инструменты, основываясь на практических паттернах и антипаттернах, наблюдаемых в разработке.
Три вопроса для определения использования агента
Автор рекомендует задать три вопроса перед внедрением агента:
- Известна ли процедура? Если вы можете заранее записать точные шаги, лучше использовать скрипт.
- Сколько элементов? Агенты лучше всего работают с единичными сложными случаями, а не с тысячами похожих элементов, таких как счета.
- Независимы ли элементы? Если элементы не связаны, их обработка в одном контексте агента может привести к утечке деталей между элементами.
Когда все три указывают на агента (неизвестная процедура, небольшое количество случаев, взаимосвязанные элементы) — это идеальный вариант использования.
Распространённые антипаттерны
В посте выделены несколько задач, которые не выигрывают от рассуждений агента:
- Развёртывание тестовых сред (вместо этого используйте CI-пайплайн)
- Обработка пакетов счетов (используйте map над списком)
- Синхронизация данных между системами (используйте ETL)
- Отправка запланированных отчётов (используйте cron job)
У этих задач известные процедуры, и они не требуют накладных расходов на рассуждения агента.
Различие между агентом и LLM-пайплайном
Ключевое различие: использование LLM не делает что-то автоматически агентом. LLM в пайплайне функционирует как «текст на входе — текст на выходе» без автономии, вызова инструментов или многошаговых рассуждений. Агент — это цикл, который выбирает, что делать дальше, на основе промежуточных результатов. Многие задачи, построенные как агенты, на самом деле являются задачами LLM-пайплайна.
Где агенты преуспевают
Агенты сияют в сценариях, требующих динамической композиции известных инструментов, где последовательность зависит от промежуточных результатов:
- Кодирующие агенты, которые читают баги, формируют гипотезы, пишут исправления, запускают тесты и вносят правки
- Исследователи, которые переформулируют запросы на основе находок
- Творческая работа
- Рабочие процессы с участием человека в цикле
Лучшая архитектура часто гибридная: агенты для размышлений, код для действий. Кодирующий агент может написать исправление, но CI-пайплайн, тестирующий его, остаётся стандартной инфраструктурой.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Разработчик создал 3D-визуализацию GitHub в виде города с помощью кода Claude за один день.
Разработчик создал Git City — трёхмерную визуализацию, где пользователи GitHub представлены в виде пиксельных зданий, высота которых зависит от количества коммитов, а ширина — от репозиториев. Проект был полностью создан с помощью Claude Code за один день.

Использование Claude в качестве безжалостного рецензента UI/UX с конкретным промтом-персоной
Пользователь Reddit делится промптом, который превращает Claude в безжалостного UI/UX-консультанта, анализирующего работающие приложения в два этапа: сначала как беспощадный дизайнер, затем как пользователь-новичок, выводя результаты в приоритизированном markdown-файле.

Фреймворк Autoevolve использует код Claude для разработки игрового ИИ через эволюцию в процессе самоигры.
Разработчик использовал исключительно Claude Code для участия в Game AI Cup, заняв 6-е место из 83 участников после 130 автоматизированных итераций. Фреймворк autoevolve реализует цикл самообучающейся эволюции, в котором Claude анализирует производительность бота, предлагает изменения и сравнивает новые версии с предыдущими.

Документы разработчика: Использование 11,7 млрд токенов Claude за 45 дней, детали по четырем проектам.
Разработчик отследил использование 11,7 миллиарда токенов Claude за 45 дней, детализировав четыре созданных проекта, включая систему мониторинга трафика в реальном времени, математическую модель сознания, собственную архитектуру трансформера и инструмент анализа платформы для ИИ-программирования.