Pipeline Multiagente com Claude: Produção de Vídeos no YouTube

Um desenvolvedor construiu um pipeline de IA multiagente que recebe um tópico (ex.: "Ada Lovelace") e uma persona (identidade do canal, tom, estilo visual) e produz um vídeo educacional completo para o YouTube, estruturado em capítulos (15–20 min). O pipeline usa o Claude como LLM principal para roteirização e orquestra agentes especializados em escrita de roteiro, geração de assets, renderização (CUDA no host Windows) e upload para o YouTube.

Escrita de Roteiro via Arquitetura de Contrato

Para manter um roteiro de 20 minutos escrito por IA coeso narrativamente entre capítulos escritos em chamadas LLM separadas, o sistema usa um contrato narrativo — um blueprint JSON validado gerado antes de qualquer texto do roteiro ser escrito. O contrato codifica quatro tipos de restrição:

Threads — arcos narrativos que devem abrir em um capítulo e fechar em outro, com um tipo de payoff declarado (resolvido, tragédia, etc.)
Entidades — pessoas/lugares nomeados com um capítulo de primeira introdução forçado, impedindo menções retrospectivas
Fatos Necessários — citações encadeadas com dependências (o fato B não pode aparecer até que o fato A seja estabelecido)
Âncoras Temporais — pontos de referência temporal que permitem estrutura não linear (flashback, in-medias-res) mantendo-se consistentes internamente

O contrato é gerado via um loop Opus → validação estrutural → revisão Sonnet (até 3 rodadas). O Sonnet verifica coerência semântica (sem entidades órfãs, threads realmente fecham); o validador estrutural executa um parse Pydantic + verificação de restrições temporais. Os escritores de capítulo downstream são vinculados ao contrato.

Pesquisa via Fanout

O pipeline de pesquisa ativa N instâncias paralelas de OutlineAgent, cada uma trabalhando a partir do mesmo pacote de pesquisa, mas em diferentes teses candidatas. Cada uma produz uma hierarquia de três níveis: tese → argumentos do capítulo → batidas de cena. Um loop de fundamentação/revisão é executado independentemente em cada ramo:

Revisor de fundamentação (Sonnet) sinaliza problemas bloqueadores vs. problemas de polimento
Agente de revisão aplica correções sem reestruturar
Revisor de qualidade verifica falhas estruturais (listas de capítulos tópicos, meios colapsados, finais resumidos)

Até 3 rodadas de revisão por ramo, em paralelo. Então um único agente juiz pontua cada esboço refinado em quatro eixos:

Eixo	Peso	O que mede
Gancho Conceitual	0,40	Potencial de CTR; falseabilidade do título
Fechamento da Armadilha	0,30	Completude do payoff narrativo

Arquitetura do Pipeline

O pipeline é dividido em dois ambientes: o trabalho de roteiro e assets roda em um contêiner de desenvolvimento Linux (WSL), enquanto a renderização roda no host Windows para acessar CUDA e ferramentas de vídeo. Os agentes se comunicam via HTTP com um orquestrador leve. O sistema é baseado em fases — cada etapa (W2.1, W4.3, R3.1, etc.) é independentemente reexecutável. Cada fase lê e escreve arquivos de artefato tipados (manifestos JSON, arquivos de áudio, diretórios de imagem), de modo que os agentes são fracamente acoplados.

Ferramentas integradas: Live2D, Fish Audio, Sadtalker e outras para geração de assets e renderização.

📖 Leia a fonte completa: r/ClaudeAI

Pipeline de Produção de Vídeo Multiagente com Claude: Arquitetura de Contrato de Roteiro e Fanout de Pesquisa

Escrita de Roteiro via Arquitetura de Contrato

Pesquisa via Fanout

Arquitetura do Pipeline

👀 See Also

Como um Bug no useEffect do React Causou Feedback Háptico Aleatório e Prejudicou a Retenção do Aplicativo

Construindo um Fluxo de Trabalho de Social Listening no Reddit com OpenClaw

Claude Code + Remotion: Gerando Vídeos de Lançamento de App Sem After Effects

Desenvolvimento de Jogos Steam com Claude Code: Processo de Revisão Técnica e Reestruturação de Código