Мультиагентный конвейер видеопроизводства с Claude: Архитектура скриптового контракта и исследовательский веер

Разработчик создал мультиагентный AI-конвейер, который принимает тему (например, «Ада Лавлейс») и персону (идентичность канала, тон, визуальный стиль) и создает полное образовательное видео для YouTube с разбивкой на главы (15–20 мин). Конвейер использует Claude в качестве основной LLM для сценария и координирует специализированных агентов по написанию сценария, созданию ассетов, рендерингу (CUDA на хосте Windows) и загрузке на YouTube.
Написание сценария через архитектуру контракта
Чтобы 20-минутный AI-сценарий оставался нарративно связным между главами, написанными в отдельных вызовах LLM, система использует нарративный контракт — проверенный JSON-план, созданный до написания текста. Контракт кодирует четыре типа ограничений:
- Нити — сюжетные арки, которые должны открыться в одной главе и закрыться в другой, с объявленным типом развязки (разрешение, трагедия и т.д.)
- Сущности — именованные люди/места с обязательной главой первого упоминания, предотвращающей ретроактивные упоминания
- Необходимые факты — цитаты с цепочками зависимостей (факт B не может появиться, пока не установлен факт A)
- Временные якоря — точки отсчета, допускающие нелинейную структуру (флешбэк, in medias res) при сохранении внутренней согласованности
Контракт создается через цикл Opus → структурная проверка → обзор Sonnet (до 3 раундов). Sonnet проверяет семантическую связность (нет сиротских сущностей, нити действительно закрыты); структурный валидатор выполняет парсинг Pydantic и проверку временных ограничений. Последующие авторы глав привязаны к контракту.
Исследование через веер
Исследовательский конвейер запускает N параллельных экземпляров OutlineAgent, каждый работает с одним и тем же исследовательским пакетом, но с разными тезисами-кандидатами. Каждый создает трехуровневую иерархию: тезис → аргументы главы → сцены. Цикл проверки/доработки выполняется независимо для каждой ветки:
- Проверяющий (Sonnet) отмечает блокирующие проблемы vs. незначительные правки
- Агент доработки применяет исправления без реструктуризации
- Проверка качества ищет структурные сбои (тематические списки глав, провалы в середине, итоговые завершения)
До 3 раундов доработки на ветку, параллельно. Затем один судья оценивает каждый уточненный план по четырем осям:
| Ось | Вес | Что измеряется |
|---|---|---|
| Концептуальный крючок | 0.40 | CTR-потенциал; проверяемость заголовка |
| Закрытие ловушки | 0.30 | Полнота нарративной развязки |
Архитектура конвейера
Конвейер разделен на две среды: работа со сценарием и ассетами выполняется в dev-контейнере Linux (WSL), а рендеринг — на хосте Windows для доступа к CUDA и инструментам видео. Агенты общаются по HTTP с легковесным оркестратором. Система пофазная — каждый шаг (W2.1, W4.3, R3.1 и т.д.) может быть перезапущен независимо. Каждая фаза читает и записывает типизированные артефакты (JSON-манифесты, аудиофайлы, каталоги изображений), что обеспечивает слабую связность агентов.
Интегрированные инструменты: Live2D, Fish Audio, Sadtalker и другие для генерации ассетов и рендеринга.
📖 Источник: r/ClaudeAI
👀 Смотрите также

Искусственный интеллект Claude используется как резервный мозг для Alexa для обработки неподдерживаемых команд.
Разработчик создал легковесный слой, в котором Claude AI обрабатывает каждую неудачную команду Alexa, работая с хинди, трансляцией CCTV и управлением неумными устройствами. Система использует WebSocket для управления телевизором, DLNA для приставок и преобразование RTSP→HLS для CCTV.

Искусственные интеллекты самостоятельно устанавливают защитные меры в открытом эксперименте.
Разработчик запустил 5 ИИ-агентов на 3 недели с открытым заданием решить проблемы разработчиков. 28 из 170+ прототипов независимо пришли к созданию сканеров безопасности и контроля затрат — защитные механизмы, которые агенты создали для себя без запроса.

Использование Obsidian с OpenClaw в качестве системы второго мозга
Разработчик делится своей настройкой, используя OpenClaw с Obsidian в качестве системы «второго мозга», реализуя QMD для эффективного поиска заметок и загрузки навыков по требованию, что сокращает использование токенов на 80–90%.

Продуктовый дизайнер выпускает приложение для записи экрана macOS с помощью кода Claude
Продуктовый дизайнер с минимальным опытом работы в Xcode использовал Claude Code для создания и выпуска Drishti Studio — приложения для записи экрана на macOS. Разработчик начал с небольших функций, со временем усовершенствовал свой рабочий процесс с Claude и выпустил приложение с бесплатным пробным периодом, доступным на drishtistudio.app.