Конвейер TDD с ИИ: Как плохие инструкции породили 3 400 тестов и что это исправило

✍️ OpenClawRadar📅 Опубликовано: 2 апреля 2026 г.🔗 Source

Проблема: Буквальное толкование в масштабе

Разработчик создал многокомпонентный конвейер TDD с использованием Claude Code, где разные агенты выполняют конкретные задачи: один пишет тесты, другой пишет код для их прохождения, третий проводит ревью всего, а четвёртый ищет граничные случаи. Исходная инструкция была простой: «написать тесты для всего».

Система, казалось, работала — количество тестов продолжало расти, и CI был зелёным. Однако аудит выявил проблемы с 3400 сгенерированными тестами:

44% валидных
30% нуждались в доработке
26% полная ерунда

Бесполезные тесты включали:

Тесты, которые создавали объект JSON-конфигурации, а затем утверждали, что он равен самому себе
Тесты, которые проверяли, имеет ли интерфейс TypeScript правильную структуру, путём создания объекта и утверждения, что он соответствует только что созданному
Тесты для статических файлов, которые никогда не изменятся

Разработчик удалил почти 20 000 строк тестового кода и определил основную проблему: «Claude не облажался. Это сделал я. Я сказал „написать тесты для всего“, и он услышал меня громко и чётко. Каждый файл. Каждый конфиг. Каждое определение типа. Мои инструкции были проблемой, и агент следовал им идеально».

Решение: Классификация и ревью

Исправление включало два ключевых изменения:

1. Классификация рабочих элементов перед тестированием:

Функции получают 3–5 поведенческих тестов (действительно ли это работает?)
Задачи получают 1–2 дымовых теста (не сломало ли что-то очевидное?)
Ошибки получают 2–3 регрессионных теста (вернётся ли эта конкретная ошибка?)
Улучшения тестируют только новое или изменённое поведение

2. Добавление агента ревью: Отдельный агент рассматривает и тесты, и реализацию с новым контекстом, выявляя проблемы, которые пропустили агенты-писатели, потому что были слишком близки к своему собственному выводу.

Результаты после исправления

3400 тестов сократились до 2525
Время выполнения упало со 117 секунд до ~50 секунд
Каждый оставшийся тест проверяет фактическое поведение

Ключевое понимание

«Создание с помощью ИИ-агентов делает ваше небрежное мышление видимым в масштабе. Человек пишет плохие тесты — вы получаете несколько плохих тестов. Дадите плохую инструкцию конвейеру агентов, обрабатывающему сотни рабочих элементов? Вы получите сотни плохих тестов. То же плохое мышление, просто усиленное во всём, к чему оно прикасается. Исправьте мышление — исправьте результат».

📖 Read the full source: r/ClaudeAI

👀 Смотрите также

Кейсы

Трюк OpenClaw: Как скрыть проекты и сеансы для непрерывной памяти агента

Разработчик утверждает, что OpenClaw не изобретает «волшебную память», а перестраивает работу с проектами, сессиями и памятью под локальные AI-инструменты кодинга (Claude Code, Codex CLI). Он использует файловую память и маршрутизацию чатов для создания бесшовного ассистента.

6 мая 2026 г., 14:22 UTC

OpenClawRadar

Кейсы

ИИ-игра о правах потребителей переходит в сектор B2B: рабочий процесс Claude Code с Opus 4.7 и Haiku 4.5

Разработчик описывает, как они использовали Claude Code с Opus 4.7 для рефакторинга бэкенда и Haiku 4.5 для живого чата в B2B-инструменте для обучения продажам, делясь своим рабочим процессом с CLAUDE.md / SPLIT_NOTES.md.

6 мая 2026 г., 16:17 UTC

OpenClawRadar

Кейсы

Основатель-одиночка использует код Claude для подачи документов в FDA и проверки патентов.

Основатель-одиночка, создающий бесконтактный монитор сна, использовал Claude Code в течение 10-часовой сессии, чтобы подать предварительную заявку в FDA, создать 8 регуляторных документов, провести параллельную проверку патента агентами и обновить 38 ссылок в документах после изменений в регулировании.

31 мар. 2026 г., 12:45 UTC

OpenClawRadar

Кейсы

Три практических шаблона для заработка с помощью OpenClaw

Анализ 100 пользователей OpenClaw выявил три устойчивых подхода: превращение существующих знаний в AI-ассистентов, автоматизация повторяющихся исследований и продажа результатов, экономящих время, а не функций искусственного интеллекта.

18 мар. 2026 г., 07:45 UTC

OpenClawRadar