Pipeline de récapitulation de films locale utilisant Whisper + CLIP + Ollama

✍️ OpenClawRadar📅 Publié: May 3, 2026🔗 Source
Pipeline de récapitulation de films locale utilisant Whisper + CLIP + Ollama
Ad

Un développeur a construit un pipeline automatisé qui transforme n'importe quel film en une vidéo de résumé narrée. La pile est entièrement locale : Whisper pour la transcription, CLIP pour l'appariement des scènes, Ollama (ou OpenAI/Gemini/Anthropic) pour la génération du script, Edge TTS pour la voix off, et FFmpeg pour le rendu.

Comment ça marche

  • Entrée : Déposez n'importe quel fichier film via une interface web simple.
  • Transcription : Whisper extrait les dialogues et les horodatages.
  • Appariement des scènes : CLIP identifie les scènes visuelles qui correspondent au récit.
  • Génération du script : Ollama (ou n'importe quel fournisseur d'API) écrit un script de résumé concis.
  • Voix off et rendu : Edge TTS génère la narration, FFmpeg compose le tout en une vidéo finale.

L'ensemble du processus s'exécute localement avec Ollama, mais vous pouvez aussi brancher des API LLM distantes (OpenAI, Gemini, Anthropic). La durée totale est d'environ 15 minutes. Aucune édition manuelle requise.

Ad

Pour qui c'est fait

Les développeurs qui construisent des pipelines de génération vidéo automatisés ou toute personne souhaitant produire en série des résumés de films sans dépendances cloud.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Tatu : Couche de sécurité open-source pour Claude qui masque les secrets et commandes destructrices dans les blocs de code
Tools

Tatu : Couche de sécurité open-source pour Claude qui masque les secrets et commandes destructrices dans les blocs de code

Tatu est un système de crochets open-source qui intercepte les actions de Claude Code en temps réel pour bloquer les secrets divulgués, signaler les informations personnelles identifiables (PII) et refuser les commandes destructrices avant leur exécution. L'installation se fait via pip/pipx avec 'tatu-hook init' pour activer le mode audit.

OpenClawRadar
L'extension Compass pour Chrome ajoute des outils de navigation à Claude et ChatGPT
Tools

L'extension Compass pour Chrome ajoute des outils de navigation à Claude et ChatGPT

Un développeur a créé une extension Chrome gratuite appelée Compass qui ajoute une mini-carte de prompts, des en-têtes de défilement fixes, des listes de contrôle de session et des modèles de création de prompts aux interfaces Claude et ChatGPT pour résoudre les problèmes de navigation dans les conversations longues.

OpenClawRadar
Constrails : Couche de gouvernance externe en phase alpha précoce pour les agents IA
Tools

Constrails : Couche de gouvernance externe en phase alpha précoce pour les agents IA

Constrails est une couche externe de gouvernance d'exécution pour les agents d'IA qui place une couche de contrôle entre les agents et leurs outils, mettant en œuvre des vérifications de capacités, une évaluation des risques, une évaluation des politiques et une journalisation d'audit. Le projet en phase alpha précoce vise à répondre aux préoccupations de sécurité en déplaçant les contrôles en dehors de l'agent lui-même.

OpenClawRadar
CRMy : CRM Open Source et Moteur de Contexte Client pour OpenClaw
Tools

CRMy : CRM Open Source et Moteur de Contexte Client pour OpenClaw

CRMy est un CRM open source et un moteur de contexte client conçu spécifiquement pour les agents OpenClaw. Il inclut une interface CLI complète, un plugin OpenClaw avec 12 outils CRM, un backend PostgreSQL, et un déploiement auto-hébergé avec deux commandes.

OpenClawRadar