Конвейер рекапитуляции фильмов с локальным приоритетом с использованием Whisper + CLIP + Ollama

✍️ OpenClawRadar📅 Опубликовано: 3 мая 2026 г.🔗 Source
Конвейер рекапитуляции фильмов с локальным приоритетом с использованием Whisper + CLIP + Ollama
Ad

Разработчик создал автоматизированный пайплайн, который превращает любой фильм в видео-пересказ с озвучкой. Стек полностью локальный: Whisper для транскрибации, CLIP для сопоставления сцен, Ollama (или OpenAI/Gemini/Anthropic) для генерации сценария, Edge TTS для озвучки и FFmpeg для рендеринга.

Как это работает

  • Ввод: Загрузите любой файл фильма через простой веб-интерфейс.
  • Транскрибация: Whisper извлекает диалоги и временные метки.
  • Сопоставление сцен: CLIP определяет визуальные сцены, соответствующие повествованию.
  • Генерация сценария: Ollama (или любой провайдер API) пишет краткий сценарий пересказа.
  • Озвучка и рендеринг: Edge TTS генерирует narration, FFmpeg собирает все в итоговое видео.

Весь процесс выполняется локально с Ollama, но вы также можете подключать удаленные LLM API (OpenAI, Gemini, Anthropic). Общее время выполнения — примерно 15 минут. Ручное редактирование не требуется.

Ad

Для кого это

Для разработчиков, создающих автоматизированные пайплайны генерации видео, или для тех, кто хочет массово создавать пересказы фильмов без облачных зависимостей.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Смотрите также

Локальная модель 35B MoE снижает частоту сбоев кода Agent OS до 0%
Инструменты

Локальная модель 35B MoE снижает частоту сбоев кода Agent OS до 0%

Разработчик сообщает, что переключение среды выполнения мультиагентной системы на Qwen 3.6 35B A3B (MoE, 3B активных параметров) устранило сбои в коде, обеспечив 100% успех благодаря 5-уровневому проверочному шлюзу.

OpenClawRadar
OpenTidy: Фоновый помощник с открытым исходным кодом на основе Claude Code для административных задач
Инструменты

OpenTidy: Фоновый помощник с открытым исходным кодом на основе Claude Code для административных задач

OpenTidy — это сервис с открытым исходным кодом для macOS, который запускает постоянные сессии Claude Code для выполнения административных задач, таких как обработка счетов, заполнение форм и сортировка сообщений. Он выполняет до 10 параллельных задач с уведомлениями в Telegram для чувствительных действий.

OpenClawRadar
Prism MCP v2.1 добавляет постоянную память к сессиям Claude.
Инструменты

Prism MCP v2.1 добавляет постоянную память к сессиям Claude.

Prism MCP v2.1.0 'Дворец разума' обеспечивает постоянную память сессий для Claude, устраняя необходимость повторного объяснения контекста проекта. Он включает локальное хранилище SQLite, визуальный браузер памяти, откат состояния и синхронизацию контекста между клиентами.

OpenClawRadar
Использование Claude для автоматизации тестирования мобильных приложений с помощью Capacitor WebViews
Инструменты

Использование Claude для автоматизации тестирования мобильных приложений с помощью Capacitor WebViews

Разработчик создал автоматизированную систему контроля качества с использованием Claude для тестирования мобильного приложения на базе Capacitor на Android и iOS. Подход использует Chrome DevTools Protocol для Android WebViews и скриншоты для визуального анализа, при этом настройка Android заняла 90 минут, а iOS — более 6 часов.

OpenClawRadar