Arquitectura de Contrato de Guión y Expansión de Investigación para un Pipeline de Producción de Video Multiagente con Claude

Un desarrollador creó un pipeline de IA multiagente que toma un tema (por ejemplo, "Ada Lovelace") y una personalidad (identidad del canal, tono, estilo visual) y produce un video educativo completo de YouTube estructurado en capítulos (15-20 min). El pipeline usa Claude como LLM principal para la escritura de guiones y orquesta agentes especializados en redacción de guiones, generación de activos, renderizado (CUDA en host Windows) y subida a YouTube.
Escritura de guiones mediante arquitectura de contrato
Para mantener un guion generado por IA de 20 minutos coherente narrativamente a través de capítulos escritos en llamadas separadas al LLM, el sistema utiliza un contrato narrativo: un plano JSON validado generado antes de escribir cualquier texto del guion. El contrato codifica cuatro tipos de restricciones:
- Hilos — arcos narrativos que deben abrirse en un capítulo y cerrarse en otro, con un tipo de desenlace declarado (resuelto, tragedia, etc.)
- Entidades — personas/lugares nombrados con un capítulo de primera introducción forzada, evitando menciones retroactivas
- Hechos requeridos — citas encadenadas con dependencias (el hecho B no puede aparecer hasta que se establezca el hecho A)
- Anclas temporales — puntos de referencia temporales que permiten una estructura no lineal (flashback, in medias res) manteniendo la coherencia interna
El contrato se genera mediante un bucle Opus → validación estructural → revisión Sonnet (hasta 3 rondas). Sonnet verifica la coherencia semántica (sin entidades huérfanas, los hilos realmente se cierran); el validador estructural ejecuta un análisis Pydantic + verificación de restricciones temporales. Los escritores de capítulos posteriores están sujetos al contrato.
Investigación mediante despliegue
El pipeline de investigación inicia N instancias paralelas de OutlineAgent, cada una trabajando con el mismo paquete de investigación pero con diferentes tesis candidatas. Cada una produce una jerarquía de tres niveles: tesis → argumentos de capítulo → beats de escena. Un bucle de fundamentación/revisión se ejecuta de forma independiente en cada rama:
- Revisor de fundamentación (Sonnet) señala problemas bloqueantes frente a problemas de pulido
- Agente de revisión aplica correcciones sin reestructurar
- Revisor de calidad verifica fallos estructurales (listas de capítulos temáticos, colapsos en el medio, finales resumen)
Hasta 3 rondas de revisión por rama, en paralelo. Luego un único agente juez puntúa cada esquema refinado en cuatro ejes:
| Eje | Peso | Qué mide |
|---|---|---|
| Gancho conceptual | 0.40 | Potencial de CTR; falseabilidad del título |
| Cierre de trampa | 0.30 | Completitud del desenlace narrativo |
Arquitectura del pipeline
El pipeline está dividido en dos entornos: el trabajo de guion y activos se ejecuta en un contenedor de desarrollo Linux (WSL), mientras que el renderizado se ejecuta en el host Windows para acceder a CUDA y herramientas de video. Los agentes se comunican por HTTP con un orquestador ligero. El sistema está basado en fases: cada paso (W2.1, W4.3, R3.1, etc.) se puede volver a ejecutar de forma independiente. Cada fase lee y escribe archivos de artefactos tipados (manifiestos JSON, archivos de audio, directorios de imágenes) para que los agentes estén débilmente acoplados.
Herramientas integradas: Live2D, Fish Audio, Sadtalker, y otras para la generación y renderizado de activos.
📖 Lee la fuente completa: r/ClaudeAI
👀 Ver también

BeanWhisperer: La herramienta de IA OpenClaw genera perfiles de presión GaggiMate a partir de información sobre granos de café.
BeanWhisperer es una herramienta de código abierto que utiliza OpenClaw AI para analizar información sobre granos de café y generar o seleccionar automáticamente perfiles de presión de GaggiMate. Envía los perfiles directamente a las máquinas a través de WebSocket, eliminando la copia manual de JSON.

Claude Code permite que un recién graduado desarrolle en solitario un juego multijugador en tiempo real
Un recién graduado sin experiencia formal en ingeniería de software usó Claude Code para construir imageclash.net, un juego multijugador en tiempo real con autoescalado serverless de GPU, experiencia de usuario con el móvil como mando y gestión del ciclo de vida de imágenes basada en R2.

Desarrollador Construye Juego de Texto Track Star Usando a Claude como Socio de Programación
Un desarrollador utilizó Claude como compañero de programación principal para construir Track Star, un juego de simulación de carrera de atletismo basado en texto, llenando vacíos en su conocimiento de Python durante el trabajo nocturno y de fin de semana durante varios meses. La demostración pulida se lanzó en Steam la semana pasada.

Construyendo Habilidades Personalizadas de Análisis de Imágenes en OpenClaw con Modelos Locales
Un desarrollador creó una habilidad personalizada OpenClaw para analizar imágenes usando Qwen2.5 VL ejecutándose localmente a través de Ollama en Windows 11 con WSL, evitando las limitaciones de imágenes de la WebUI mediante llamadas API y scripts personalizados.