Запуск Claude Code в качестве чистого механизма оценки на протяжении всего SDLC

✍️ OpenClawRadar📅 Опубликовано: 5 мая 2026 г.🔗 Source
Запуск Claude Code в качестве чистого механизма оценки на протяжении всего SDLC
Ad

Разработчик на r/ClaudeAI подробно описал свою многомесячную настройку использования Claude Code (среда выполнения с использованием инструментов и многошаговым циклом) на всем протяжении жизненного цикла разработки ПО — задачи, реализация в нескольких репозиториях, ревью кода, MR и постоянный уровень знаний.

Ключевое архитектурное решение: Не допускать Claude Code к оркестрации. Обычный Python выполняет всю механическую работу: вызовы API Jira, операции с git, запуск тестов, линтинг, перемещение файлов. Claude Code вызывается только для принятия решений — написания кода, оценки результатов ревью, выбора между архитектурными вариантами. Автор обнаружил, что смешивание этих двух задач (позволение агенту оркестровать через инструменты) делало первую версию медленной, дорогой и недетерминированной.

Конкретный жизненный цикл одной задачи:

  • Оркестратор Python: Получает задачу из Jira, ищет в локальной вики связанные архитектурные решения, настраивает рабочее дерево на новой ветке, собирает краткое описание реализации на 30–50 строк (критерии приемки, целевые файлы, вызывающие измененные общие функции, соответствующие стандарты). Выводит JSON-пакет.
  • Claude Code: Читает описание и пишет код. Это единственный шаг со значительным потреблением токенов.
  • Python + подагент ревью: Запускает тесты, линтинг, форматирование. При неудаче передает обратно агенту реализации (максимум 3 повторных попытки). Затем запускает подагент ревью кода, настроенный без прав на редактирование или запись — он может только читать и сообщать о найденных проблемах.
  • Python: Создает предложение в панели управления. После ручного одобрения оркестратор отправляет изменения и создает MR.

Конкретные методы Claude Code, которые оказались важными:

  • Изоляция подагентов. Агент ревью работает в своем собственном контекстном окне с запретным списком (Edit, Write). Разделение ревью и реализации помогло выявить изменения в поведении общего кода, которые агент реализации постоянно упускал.
  • Предварительно собранные описания лучше динамического исследования. Раньше позволение Claude Code исследовать кодовую базу перед реализацией потребляло заметно больше токенов, чем передача ему сфокусированного описания, собранного Python (получение из Jira, поиск в вики, анализ зависимостей).
  • Маршрутизация навыков/команд через YAML, а не позволение агенту решать. Отображение от /ticket, /review, /standup и т.д. к оркестраторам является явным, поэтому возможности можно проверить, а не возникают спонтанно.
  • Хуки блокируют коммиты. Pre-commit хук запускает линтинг и форматирование перед любым коммитом, который пытается сделать Claude Code. Нарушения блокируют коммит; агент должен их исправить.

Уровень вики: Страницы Markdown с тремя уровнями достоверности (подтверждено, предположено, предоставлено человеком) и порогами устаревания на уровне полей. Без уровней агенты принимают свои собственные прошлые предположения за истину и превращают галлюцинации в авторитетные знания.

Ad

Проблемы, которые все еще решаются:

  • Функции, затрагивающие несколько репозиториев: агент теряет связность, когда функция охватывает несколько сервисов, даже с отслеживанием структурированного набора изменений.
  • Нечеткие задачи: агент выдает разумные, но часто неправильные реализации из неоднозначных спецификаций. Автор теперь помечает нечеткие задачи как блокирующие.
  • Расширение объема: склонность к излишней инженерии требует постоянной калибровки через стандарты и агента ревью.
  • Длинные сессии: ранний контекст выпадает из эффективного внимания; реинициализация при старте сессии смягчает, но не устраняет проблему.

📖 Читать полный источник: r/ClaudeAI

Ad

👀 Смотрите также

Искусственные интеллекты самостоятельно устанавливают защитные меры в открытом эксперименте.
Кейсы

Искусственные интеллекты самостоятельно устанавливают защитные меры в открытом эксперименте.

Разработчик запустил 5 ИИ-агентов на 3 недели с открытым заданием решить проблемы разработчиков. 28 из 170+ прототипов независимо пришли к созданию сканеров безопасности и контроля затрат — защитные механизмы, которые агенты создали для себя без запроса.

OpenClawRadar
UPSC StatsBuddy Bot: Телеграм-интерфейс для данных правительства Индии через Claude AI
Кейсы

UPSC StatsBuddy Bot: Телеграм-интерфейс для данных правительства Индии через Claude AI

Разработчик создал Telegram-бота под названием UPSC StatsBuddy, который подключается к серверу MCP индийского Министерства статистики и программной реализации (MoSPI), используя Claude AI для преобразования сложных государственных наборов данных в понятные, цитируемые ответы для абитуриентов UPSC менее чем за 30 часов.

OpenClawRadar
Использование OpenClaw на Raspberry Pi в качестве аппаратной лаборатории ИИ для управления устройствами
Кейсы

Использование OpenClaw на Raspberry Pi в качестве аппаратной лаборатории ИИ для управления устройствами

Разработчик запускает OpenClaw на выделенном Raspberry Pi для управления аппаратными устройствами через Discord, обрабатывая прошивку, устранение неполадок и системные операции через подчинённых агентов с защитными механизмами, такими как резервное копирование и пути отката.

OpenClawRadar
Автономное тестирование Super Mario с использованием моделей поведения
Кейсы

Автономное тестирование Super Mario с использованием моделей поведения

Изучите автономное тестирование в Super Mario с помощью основанного на мутациях генератора ввода для обнаружения крайних случаев и более эффективного исследования пространств состояний.

OpenClawRadar