Конвейер рекапитуляции фильмов с локальным приоритетом с использованием Whisper + CLIP + Ollama

Разработчик создал автоматизированный пайплайн, который превращает любой фильм в видео-пересказ с озвучкой. Стек полностью локальный: Whisper для транскрибации, CLIP для сопоставления сцен, Ollama (или OpenAI/Gemini/Anthropic) для генерации сценария, Edge TTS для озвучки и FFmpeg для рендеринга.
Как это работает
- Ввод: Загрузите любой файл фильма через простой веб-интерфейс.
- Транскрибация: Whisper извлекает диалоги и временные метки.
- Сопоставление сцен: CLIP определяет визуальные сцены, соответствующие повествованию.
- Генерация сценария: Ollama (или любой провайдер API) пишет краткий сценарий пересказа.
- Озвучка и рендеринг: Edge TTS генерирует narration, FFmpeg собирает все в итоговое видео.
Весь процесс выполняется локально с Ollama, но вы также можете подключать удаленные LLM API (OpenAI, Gemini, Anthropic). Общее время выполнения — примерно 15 минут. Ручное редактирование не требуется.
Для кого это
Для разработчиков, создающих автоматизированные пайплайны генерации видео, или для тех, кто хочет массово создавать пересказы фильмов без облачных зависимостей.
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также

Локальная модель 35B MoE снижает частоту сбоев кода Agent OS до 0%
Разработчик сообщает, что переключение среды выполнения мультиагентной системы на Qwen 3.6 35B A3B (MoE, 3B активных параметров) устранило сбои в коде, обеспечив 100% успех благодаря 5-уровневому проверочному шлюзу.

OpenTidy: Фоновый помощник с открытым исходным кодом на основе Claude Code для административных задач
OpenTidy — это сервис с открытым исходным кодом для macOS, который запускает постоянные сессии Claude Code для выполнения административных задач, таких как обработка счетов, заполнение форм и сортировка сообщений. Он выполняет до 10 параллельных задач с уведомлениями в Telegram для чувствительных действий.

Prism MCP v2.1 добавляет постоянную память к сессиям Claude.
Prism MCP v2.1.0 'Дворец разума' обеспечивает постоянную память сессий для Claude, устраняя необходимость повторного объяснения контекста проекта. Он включает локальное хранилище SQLite, визуальный браузер памяти, откат состояния и синхронизацию контекста между клиентами.

Использование Claude для автоматизации тестирования мобильных приложений с помощью Capacitor WebViews
Разработчик создал автоматизированную систему контроля качества с использованием Claude для тестирования мобильного приложения на базе Capacitor на Android и iOS. Подход использует Chrome DevTools Protocol для Android WebViews и скриншоты для визуального анализа, при этом настройка Android заняла 90 минут, а iOS — более 6 часов.