Pipeline de Recapitulación de Películas Local-Primero Usando Whisper + CLIP + Ollama

✍️ OpenClawRadar📅 Publicado: 3 de mayo de 2026🔗 Source
Pipeline de Recapitulación de Películas Local-Primero Usando Whisper + CLIP + Ollama
Ad

Un desarrollador creó un pipeline automatizado que convierte cualquier película en un video de resumen narrado. La pila es completamente local: Whisper para la transcripción, CLIP para la coincidencia de escenas, Ollama (o OpenAI/Gemini/Anthropic) para la generación del guion, Edge TTS para la locución y FFmpeg para la renderización.

Cómo funciona

  • Entrada: Introduce cualquier archivo de película a través de una interfaz web simple.
  • Transcripción: Whisper extrae el diálogo y las marcas de tiempo.
  • Coincidencia de escenas: CLIP identifica las escenas visuales que coinciden con la narrativa.
  • Generación del guion: Ollama (o cualquier proveedor de API) escribe un guion de resumen conciso.
  • Locución y renderizado: Edge TTS genera la narración, FFmpeg compone todo en un video final.

Todo el proceso se ejecuta localmente con Ollama, pero también puedes conectar API de LLM remotas (OpenAI, Gemini, Anthropic). El tiempo total de ejecución es de aproximadamente 15 minutos. No se requiere edición manual.

Ad

Para quién es

Desarrolladores que construyen pipelines automatizados de generación de videos o cualquier persona que quiera producir en lote resúmenes de películas sin dependencias en la nube.

📖 Lee la fuente completa: r/LocalLLaMA

Ad

👀 Ver también

Habilidades de Claude para Emular un Entorno de Estudio de Diseño
Herramientas

Habilidades de Claude para Emular un Entorno de Estudio de Diseño

Un diseñador comparte dos habilidades de Claude: una simula un estudio con compañeros y métodos de diseño, la otra añade 'juego riguroso' para la creatividad.

OpenClawRadar
Usuario de Reddit mide la sobrecarga de tokens MCP: 67K tokens consumidos antes de cualquier pregunta.
Herramientas

Usuario de Reddit mide la sobrecarga de tokens MCP: 67K tokens consumidos antes de cualquier pregunta.

Un desarrollador midió la sobrecarga de tokens de su servidor MCP en 67.000 tokens consumidos antes de escribir una sola pregunta, con Playwright MCP usando 13.600 tokens y GitHub MCP usando 18.000 tokens en estado inactivo. Reemplazaron MCP con habilidades y herramientas CLI para reducir los costes de contexto.

OpenClawRadar
Claude TimeTrack: aplicación de la barra de menú de macOS que lee archivos JSONL de Claude Code para rastrear automáticamente el tiempo de desarrollo por proyecto
Herramientas

Claude TimeTrack: aplicación de la barra de menú de macOS que lee archivos JSONL de Claude Code para rastrear automáticamente el tiempo de desarrollo por proyecto

Aplicación de código abierto para la barra de menú de macOS que analiza archivos JSONL de sesiones de Claude Code y el historial de git para registrar automáticamente el tiempo por proyecto, sin necesidad de temporizadores manuales.

OpenClawRadar
Clawback: Implementación basada en hooks de bucles de verificación de Claude filtrados
Herramientas

Clawback: Implementación basada en hooks de bucles de verificación de Claude filtrados

Clawback es un proyecto de GitHub que reimplementa los bucles de verificación de la filtración del mapa de fuentes de Claude como ganchos mecánicos en lugar de prompts. Incluye ganchos de parada, PreToolUse, PostToolUse y PostCompact que el modelo no puede omitir bajo presión de contexto.

OpenClawRadar