LetMeWatch: Complemento de Python Agrega Análisis de Video a Claude mediante Detección de Escenas con FFmpeg

✍️ OpenClawRadar📅 Publicado: 25 de marzo de 2026🔗 Source
LetMeWatch: Complemento de Python Agrega Análisis de Video a Claude mediante Detección de Escenas con FFmpeg
Ad

Un desarrollador ha creado un complemento de Python llamado LetMeWatch que permite a Claude analizar contenido de video a pesar de su falta de soporte nativo para video. La herramienta aborda el caso de uso específico de enviar grabaciones de pantalla de errores a Claude para su diagnóstico.

Cómo funciona

El complemento utiliza la detección de escenas de FFmpeg para extraer solo los fotogramas donde realmente cambian las imágenes. Asigna una marca de tiempo a cada fotograma extraído y los envía a Claude en lotes. Este enfoque evita el uso de modelos de video de IA o infraestructura compleja: se basa en la extracción de fotogramas combinada con las capacidades de visión multimodal existentes de Claude.

Implementación técnica

  • Escrito en Python (aproximadamente 200 líneas de código)
  • Utiliza FFmpeg para la detección de escenas
  • Extrae fotogramas solo cuando ocurren cambios visuales
  • Añade marcas de tiempo a cada fotograma
  • Envía fotogramas a Claude en lotes
  • Funciona en todas las plataformas
  • Código abierto (disponible en GitHub)
Ad

Aplicación práctica

El desarrollador probó la herramienta grabando un error en una aplicación de tareas pendientes y ejecutando el comando /video-last. Claude identificó con éxito la línea exacta con el error tipográfico al ver la grabación. Esto demuestra cómo se puede utilizar la herramienta para depurar errores al hacer que Claude analice grabaciones de pantalla de problemas.

El proyecto está disponible en github.com/BinyaminEden/letmewatch y representa una solución práctica para las limitaciones actuales de video de Claude utilizando herramientas existentes y las capacidades de visión de Claude.

📖 Read the full source: r/ClaudeAI

Ad

👀 Ver también

Pasando de las reglas de CLAUDE.md a la aplicación de infraestructura con Citadel
Herramientas

Pasando de las reglas de CLAUDE.md a la aplicación de infraestructura con Citadel

Un desarrollador descubrió que agregar más reglas a CLAUDE.md más allá de unas 100 líneas reducía el cumplimiento, con un 40% de redundancia en su archivo. La solución fue trasladar la aplicación de las reglas de las instrucciones a la infraestructura utilizando ganchos del ciclo de vida, habilidades y archivos de campaña, culminando en el sistema de código abierto Citadel.

OpenClawRadar
Habilidad de código abierto de Claude para marcos de consultoría de gestión y estudios de casos
Herramientas

Habilidad de código abierto de Claude para marcos de consultoría de gestión y estudios de casos

Una habilidad gratuita para Claude con licencia MIT proporciona material de referencia estructurado para trabajos de consultoría de gestión, incluyendo marcos de trabajo, contexto de la industria y estudios de caso. El proyecto consta de más de 80 archivos markdown organizados por dominio y busca colaboradores para ampliar la cobertura.

OpenClawRadar
Habilidad de Tendr: Operaciones CLI Determinísticas para la Gestión de Memoria del Agente
Herramientas

Habilidad de Tendr: Operaciones CLI Determinísticas para la Gestión de Memoria del Agente

Tendr Skill es una Habilidad de Agente que separa el razonamiento de la ejecución para la memoria estructurada a largo plazo, permitiendo que los agentes decidan qué necesita cambiar mientras una herramienta CLI maneja las operaciones estructurales de manera determinista. Es compatible con [[wikilinks]] y jerarquías semánticas explícitas entre archivos.

OpenClawRadar
Recuperación de código para agentes de IA: Por qué fallan los embeddings vectoriales y triunfan los gráficos LLM por archivo
Herramientas

Recuperación de código para agentes de IA: Por qué fallan los embeddings vectoriales y triunfan los gráficos LLM por archivo

Tras un año construyendo un sistema de indexación de código, el equipo de Bytebell descubrió que los embeddings vectoriales en fragmentos de código y los AST de Tree-sitter se quedaban cortos, mientras que los resúmenes por archivo generados por LLM almacenados en un grafo Neo4j con búsqueda semántica de texto completo mejoraban significativamente la precisión de la recuperación.

OpenClawRadar