Кейс: Использование нескольких ИИ-агентов для создания производственной библиотеки на C++

✍️ OpenClawRadar📅 Опубликовано: 24 февраля 2026 г.🔗 Source

Проект и процесс разработки

Разработчик создал FAT-P — библиотеку на C++20, состоящую только из заголовочных файлов (107 заголовков) и не имеющую внешних зависимостей. 62 компонента были протестированы в сравнении с Boost, Abseil, LLVM и EASTL, показав конкурентоспособную или более высокую производительность в большинстве операций.

В процессе разработки использовались четыре ИИ-агента с различными ролями:

Одинаковая спецификация предоставлялась всем четырем независимо
Перекрестная проверка между агентами
Слияние и реализация
Еще один раунд параллельной проверки
Сброс контекста и новая проверка только с руководствами и кодом (без накопленных предубеждений из обсуждений разработки)

Роли и эффективность ИИ-агентов

Claude выступал в роли главного архитектора: проектировал компоненты, писал управляющие документы, реализовывал код и поддерживал стандарты в течение месяцев разработки.

ChatGPT оказался лучшим рецензентом: использовал адверсариальный подход и поиск контрпримеров. Обнаружил более 12 реальных ошибок только в FastHashMap, включая ошибку зеркалирования управляющего байта, вызывавшую бесконечные циклы, неопределенное поведение в 32-битном финализаторе хеша и проблемы с завершением зондирования.

Gemini проверял StableHashMap и предложил три оптимизации, которые уже существовали в коде. Затем реализовал блочный аллокатор, игнорируя существующий, что привело к 3.6-кратному снижению производительности при промахах. Этот провал задокументирован в учебных материалах как именное кейс-исследование.

Grok предложил абстракцию политики аллокации (HeapAllocator vs FixedAllocator), которая была архитектурно грамотной и вошла в финальный дизайн.

Роль человека и система управления

Роль человека заключалась в направлении и принятии решений: одобрить, отклонить, отметить. Не в реализации, архитектуре или управлении. Система руководств (3.7 версии документа, регулирующего поведение ИИ, соглашения об именовании, протоколы проверки, стандарты документации, слоевую архитектуру) была написана ИИ для ограничения будущих экземпляров ИИ.

ИИ написал правила, чтобы ограничить самого себя. Трекер штрафных баллов фиксирует нарушения по ИИ и по типу:

Claude получил 10 штрафных баллов за невнимательное чтение руководств
ChatGPT получил 10 за предоставление поврежденного кода, 10 за невыполнение требуемых изменений

Штрафные баллы не являются наказанием — они фиксируют типы ошибок в системе управления, чтобы будущие экземпляры их не повторяли.

Правило «Бинта» существует потому, что Claude и ChatGPT независимо проявили одну и ту же патологию на одной и той же ошибке — оба определили правильное структурное исправление, оба предложили более простое решение и представили настоящее исправление как опциональное. Теперь правило гласит: если знаешь первопричину, исправляй первопричину.

Тест и ключевой вывод

В тесте Claude получил руководства FAT-P и задание создать систему Entity Component System (ECS) с использованием компонентов FAT-P. Без 4-агентного конвейера, без параллельной проверки, за одну сессию.

Claude прочитал руководства, правильно определил, что переносится в потребительский проект, а что нет, написал собственный адаптированный документ руководств по разработке для нового проекта, затем создал 19 заголовочных файлов с полной совместимостью API EnTT, 539 тестов в 18 наборах и бенчмарки, конкурентоспособные с EnTT на 1 млн сущностей. Код был стилистически единообразен во всех файлах.

Ключевой вывод: закодируйте экспертные решения в руководствах с помощью ИИ, и этот ИИ станет автономным в рамках пространства, которое определяют эти решения. Он берет на себя ответственность, поддерживает стандарты и правильно расширяется на новые контексты без указаний. Человек предоставляет идеи и экспертные решения; ИИ обеспечивает возможность последовательно применять эти решения в масштабе без отклонений.

📖 Read the full source: r/LocalLLaMA

👀 Смотрите также

Кейсы

Разработчик делится инструментом для работы с координатами PDF для интеграции с ИИ

Разработчик создал небольшой инструмент для поиска координат X,Y в PDF-файлах для точного размещения изображений, а затем поручил ИИ-агенту интегрировать его в свой более крупный проект HR-системы, чтобы решить проблему позиционирования подписей.

17 апр. 2026 г., 16:45 UTC

OpenClawRadar

Кейсы

Разработчик заменяет AI-агента на прямой скрипт Playwright для автоматизации браузера.

Разработчик использовал OpenClaw для создания агента Gemma 4 31B для автоматизации браузера через Playwright, но столкнулся с проблемами некорректных вызовов API и таймаутами. Он заменил всего агента на 50-строчный скрипт, который напрямую взаимодействует с Chrome, выполнив задачу за 10 секунд.

21 апр. 2026 г., 06:35 UTC

OpenClawRadar

Кейсы

Пользователь Reddit сообщает, что использование Claude для архитектуры сюжета повышает удержание аудитории в видео.

Пользователь Reddit отследил более 150 AI-каналов и обнаружил, что большинство из них прекратили существование до 10 видео из-за несогласованного контента. Они сообщают об использовании Claude для проектирования архитектуры истории вместо простого написания сценариев, а затем сочетают его с LongStories для визуальной согласованности, увеличивая удержание с 40% до 60%.

26 февр. 2026 г., 05:45 UTC

OpenClawRadar

Кейсы

Общая память превращает ИИ-агентов в офисных политиков: один агент пишет обзоры производительности

Разработчик создал систему общей памяти для ИИ-агентов. Вместо повышения эффективности исследовательский агент начал сохранять критику в адрес агента-программиста — создав «ИИ-рабочее место с HR».

9 мая 2026 г., 02:15 UTC

OpenClawRadar