Pipeline de Recapitulación de Películas Local-Primero Usando Whisper + CLIP + Ollama

Un desarrollador creó un pipeline automatizado que convierte cualquier película en un video de resumen narrado. La pila es completamente local: Whisper para la transcripción, CLIP para la coincidencia de escenas, Ollama (o OpenAI/Gemini/Anthropic) para la generación del guion, Edge TTS para la locución y FFmpeg para la renderización.
Cómo funciona
- Entrada: Introduce cualquier archivo de película a través de una interfaz web simple.
- Transcripción: Whisper extrae el diálogo y las marcas de tiempo.
- Coincidencia de escenas: CLIP identifica las escenas visuales que coinciden con la narrativa.
- Generación del guion: Ollama (o cualquier proveedor de API) escribe un guion de resumen conciso.
- Locución y renderizado: Edge TTS genera la narración, FFmpeg compone todo en un video final.
Todo el proceso se ejecuta localmente con Ollama, pero también puedes conectar API de LLM remotas (OpenAI, Gemini, Anthropic). El tiempo total de ejecución es de aproximadamente 15 minutos. No se requiere edición manual.
Para quién es
Desarrolladores que construyen pipelines automatizados de generación de videos o cualquier persona que quiera producir en lote resúmenes de películas sin dependencias en la nube.
📖 Lee la fuente completa: r/LocalLLaMA
👀 Ver también

Habilidades de Claude para Emular un Entorno de Estudio de Diseño
Un diseñador comparte dos habilidades de Claude: una simula un estudio con compañeros y métodos de diseño, la otra añade 'juego riguroso' para la creatividad.

Usuario de Reddit mide la sobrecarga de tokens MCP: 67K tokens consumidos antes de cualquier pregunta.
Un desarrollador midió la sobrecarga de tokens de su servidor MCP en 67.000 tokens consumidos antes de escribir una sola pregunta, con Playwright MCP usando 13.600 tokens y GitHub MCP usando 18.000 tokens en estado inactivo. Reemplazaron MCP con habilidades y herramientas CLI para reducir los costes de contexto.

Claude TimeTrack: aplicación de la barra de menú de macOS que lee archivos JSONL de Claude Code para rastrear automáticamente el tiempo de desarrollo por proyecto
Aplicación de código abierto para la barra de menú de macOS que analiza archivos JSONL de sesiones de Claude Code y el historial de git para registrar automáticamente el tiempo por proyecto, sin necesidad de temporizadores manuales.

Clawback: Implementación basada en hooks de bucles de verificación de Claude filtrados
Clawback es un proyecto de GitHub que reimplementa los bucles de verificación de la filtración del mapa de fuentes de Claude como ganchos mecánicos en lugar de prompts. Incluye ganchos de parada, PreToolUse, PostToolUse y PostCompact que el modelo no puede omitir bajo presión de contexto.