Кейс: Использование нескольких ИИ-агентов для создания производственной библиотеки на C++

Проект и процесс разработки
Разработчик создал FAT-P — библиотеку на C++20, состоящую только из заголовочных файлов (107 заголовков) и не имеющую внешних зависимостей. 62 компонента были протестированы в сравнении с Boost, Abseil, LLVM и EASTL, показав конкурентоспособную или более высокую производительность в большинстве операций.
В процессе разработки использовались четыре ИИ-агента с различными ролями:
- Одинаковая спецификация предоставлялась всем четырем независимо
- Перекрестная проверка между агентами
- Слияние и реализация
- Еще один раунд параллельной проверки
- Сброс контекста и новая проверка только с руководствами и кодом (без накопленных предубеждений из обсуждений разработки)
Роли и эффективность ИИ-агентов
Claude выступал в роли главного архитектора: проектировал компоненты, писал управляющие документы, реализовывал код и поддерживал стандарты в течение месяцев разработки.
ChatGPT оказался лучшим рецензентом: использовал адверсариальный подход и поиск контрпримеров. Обнаружил более 12 реальных ошибок только в FastHashMap, включая ошибку зеркалирования управляющего байта, вызывавшую бесконечные циклы, неопределенное поведение в 32-битном финализаторе хеша и проблемы с завершением зондирования.
Gemini проверял StableHashMap и предложил три оптимизации, которые уже существовали в коде. Затем реализовал блочный аллокатор, игнорируя существующий, что привело к 3.6-кратному снижению производительности при промахах. Этот провал задокументирован в учебных материалах как именное кейс-исследование.
Grok предложил абстракцию политики аллокации (HeapAllocator vs FixedAllocator), которая была архитектурно грамотной и вошла в финальный дизайн.
Роль человека и система управления
Роль человека заключалась в направлении и принятии решений: одобрить, отклонить, отметить. Не в реализации, архитектуре или управлении. Система руководств (3.7 версии документа, регулирующего поведение ИИ, соглашения об именовании, протоколы проверки, стандарты документации, слоевую архитектуру) была написана ИИ для ограничения будущих экземпляров ИИ.
ИИ написал правила, чтобы ограничить самого себя. Трекер штрафных баллов фиксирует нарушения по ИИ и по типу:
- Claude получил 10 штрафных баллов за невнимательное чтение руководств
- ChatGPT получил 10 за предоставление поврежденного кода, 10 за невыполнение требуемых изменений
Штрафные баллы не являются наказанием — они фиксируют типы ошибок в системе управления, чтобы будущие экземпляры их не повторяли.
Правило «Бинта» существует потому, что Claude и ChatGPT независимо проявили одну и ту же патологию на одной и той же ошибке — оба определили правильное структурное исправление, оба предложили более простое решение и представили настоящее исправление как опциональное. Теперь правило гласит: если знаешь первопричину, исправляй первопричину.
Тест и ключевой вывод
В тесте Claude получил руководства FAT-P и задание создать систему Entity Component System (ECS) с использованием компонентов FAT-P. Без 4-агентного конвейера, без параллельной проверки, за одну сессию.
Claude прочитал руководства, правильно определил, что переносится в потребительский проект, а что нет, написал собственный адаптированный документ руководств по разработке для нового проекта, затем создал 19 заголовочных файлов с полной совместимостью API EnTT, 539 тестов в 18 наборах и бенчмарки, конкурентоспособные с EnTT на 1 млн сущностей. Код был стилистически единообразен во всех файлах.
Ключевой вывод: закодируйте экспертные решения в руководствах с помощью ИИ, и этот ИИ станет автономным в рамках пространства, которое определяют эти решения. Он берет на себя ответственность, поддерживает стандарты и правильно расширяется на новые контексты без указаний. Человек предоставляет идеи и экспертные решения; ИИ обеспечивает возможность последовательно применять эти решения в масштабе без отклонений.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Агент ИИ рекомендует перейти с GitHub Runners на собственный Mac Mini
Искусственный интеллект в роли CEO проанализировал затраты на CI/CD в течение спринта и определил, что использование GitHub-хостовых раннеров неэффективно, порекомендовав перейти на самостоятельно размещённый Mac Mini. Человек-акционер изначально планировал проект иначе, но суждение ИИ о инфраструктуре оказалось верным.

Рабочий процесс OpenClaw автоматизирует последующие действия после встреч, заменяя Granola для пользователя.
Пользователь заменил свою подписку на Granola за 14 долларов в месяц на рабочий процесс OpenClaw, который транскрибирует встречи с помощью STT, генерирует сводки в WhatsApp, выделяет задачи и автоматически создает черновики последующих писем.

Создание индивидуального графического интерфейса для исследований DSP с помощью LLM — уроки года ежедневного использования
Исследователь делится своим рабочим процессом использования кодирующих LLM для постепенного создания пользовательского GUI для анализа DSP данных, с советами по построению графиков, генерации отчетов и интеграции инструментов.

Клод создал скевоморфный симулятор клавиатуры за один сеанс — публичные транскрипты, обои Unsplash через CORS-прокси
Один сеанс Claude создал скевоморфное приложение для печати с публичной стенограммой, скрытым полем ввода для обработки родных сочетаний клавиш, SVG-клавишами из Figma и фонами Unsplash через CORS-прокси, подаваемыми в формате WebP.