Параллельные агенты аудита: практический подход к тестированию на основе вибрации с помощью Claude

Пользователь Reddit поделился своим подходом к созданию системы параллельных агентов аудита с использованием Claude. Он "vibe-кодил" систему пользовательского тестирования, а затем попросил Claude развернуть 10 параллельных агентов аудита для оценки результата. Агенты охватывают широкий спектр областей качества и соответствия:
- Аудитор привязки к данным и галлюцинаций — проверяет фактическую точность и привязку к исходным данным.
- Страж API и коннекторов — проверяет корректность API и надежность коннекторов.
- Стресс-тестер адаптивного UI — тестирует поведение интерфейса на разных устройствах и при различных нагрузках.
- Анонимизатор PII и аналитики — гарантирует отсутствие утечки личной информации.
- Семантический и интент-агент SEO — проверяет соответствие контента поисковым намерениям пользователей и лучшим практикам SEO.
- Агент юридического и монетизационного соответствия — проверяет соблюдение юридических ограничений и политик рекламы/монетизации.
- Агенты поведенческих и трений (симуляторы человеческих эмоций) — моделируют эмоциональные реакции пользователей и точки трения.
- Агенты демографических персон (симуляторы характеристик) — тестируют с различными профилями пользователей (возраст, техническая грамотность и т.д.).
- Целевые и задачно-ориентированные агенты (тестеры воронок) — моделируют целенаправленные пути пользователей и конверсионные воронки.
- Агенты контроля контента и логики (проверщики фактов) — проверяют логическую согласованность и фактическое содержание.
Автор сообщает, что после того, как агенты обнаружили ошибки в vibe-кодированной системе, никто не поверил, что она действительно была vibe-кодирована. Он утверждает, что параллельные агенты аудита недооценены при использовании Claude. Подход демонстрирует, как несколько специализированных агентов могут работать параллельно, обеспечивая всесторонний контроль качества кода, созданного ИИ.
📖 Читать полный источник: r/ClaudeAI
👀 Смотрите также

Явное описание желаемого поведения сильнее, чем отрицательное указание.
Анализ Reddit показывает, что указания Клоду "не быть многословным" или "не морализировать" почти не работают. Вместо этого используйте положительные инструкции, такие как "отвечай в 1-2 предложения" или "дай прямой ответ, оговорки опциональны". Также окончание "спасибо!" смягчает тон.

Команда Claude /btw позволяет вести параллельное общение во время выполнения задач.
Claude AI теперь поддерживает команду /btw, которая позволяет пользователям общаться с ИИ, пока он активно выполняет задачу, позволяя задавать вопросы, давать дополнительные инструкции или уточнения, не прерывая текущий рабочий процесс.

Проблемы квантования KV-кеша в локальных кодирующих агентах при больших длинах контекста
Анализ на Reddit выявил агрессивную квантизацию KV-кэша как причину бесконечных циклов исправления и некорректных JSON-выводов в локальных кодирующих агентах, таких как Qwen3-Coder и GLM 4.7, при длине контекста свыше 30 тысяч токенов. В качестве обходных решений рекомендуется использовать смешанную точность или сокращение контекста.

20 команд Claude Code, которые должен знать каждый разработчик
Пост на Reddit перечисляет 20 команд Claude Code для остановки задач, управления контекстом, ответвлений, удаленного управления и ярлыков продуктивности, таких как /compact, /branch и /simplify.