Skill Seekers v3.2.0: Extraia Tutoriais do YouTube para Claude

O Skill Seekers v3.2.0 adiciona capacidades de extração de vídeo a esta ferramenta de código aberto que converte documentação em habilidades para o Claude. Agora você pode apontá-la para um tutorial do YouTube e obter um arquivo SKILL.md estruturado que o Claude pode usar como contexto persistente.

Como funciona

O comando básico é:

skill-seekers video --url https://youtube.com/watch?v=... --enhance-level 2

O pipeline inclui:

Extração de transcrição usando YouTube API → yt-dlp → Whisper como fallback
Extração e classificação de quadros-chave (editor de código, terminal, slides, webcam)
OCR em painéis de código com conjunto multi-engine
Acompanhamento da evolução do código entre quadros (quais linhas foram adicionadas/alteradas/removidas)
Aprimoramento de IA em duas etapas para limpeza

Fluxo de trabalho de aprimoramento de IA em duas etapas

A Etapa 1 envia o arquivo de referência bruto (OCR ruidoso + transcrição) para o Claude e pede que ele reconstrua a Linha do Tempo do Código. Isso corrige erros de OCR como l/1 e O/0, remove lixo de interface que vazou (painéis do Inspector, barras de abas) e usa a narração da transcrição como contexto para o que o código deveria ser.

A Etapa 2 pega a referência limpa e gera o SKILL.md final — um documento estruturado com etapas de configuração, exemplos de código e conceitos extraídos do tutorial.

Você pode definir fluxos de trabalho de aprimoramento personalizados em YAML:

stages:
  - name: ocr_code_cleanup
    prompt: "Limpe artefatos OCR dos blocos de código..."
  - name: tutorial_synthesis
    prompt: "Sintetize uma narrativa de ensino..."

Insights técnicos do desenvolvimento

OCR em editores de código é surpreendentemente difícil devido a decorações da IDE (números de linha, marcadores de recolhimento, barras de abas) vazando no texto
A classificação de quadros importa — quadros de webcam produzem puro lixo quando submetidos a OCR; ignorá-los reduziu a saída de lixo em ~40%
A abordagem em duas etapas foi um grande salto de qualidade, permitindo que o Claude veja tanto o contexto OCR quanto da transcrição para reconstruir código danificado

Outras fontes suportadas

Sites de documentação (presets para React, Vue, Django, FastAPI, Godot, Kubernetes e mais)
Repositórios do GitHub (análise AST, detecção de padrões)
PDFs e documentos do Word
Saídas para Claude, Gemini, OpenAI ou formatos RAG (LangChain, Pinecone, ChromaDB, etc.)

Instalação e configuração

Instale com: pip install skill-seekers

Dependências de vídeo precisam de configuração de GPU: skill-seekers video --setup (detecta automaticamente CUDA/ROCm/CPU)

📖 Leia o código-fonte completo: r/ClaudeAI

O Skill Seekers v3.2.0 adiciona extração de tutoriais do YouTube para habilidades do Claude.

Como funciona

Fluxo de trabalho de aprimoramento de IA em duas etapas

Insights técnicos do desenvolvimento

Outras fontes suportadas

Instalação e configuração

👀 See Also

yburn: Ferramenta para auditar e substituir tarefas cron desnecessárias de agentes de IA

Gerenciador de Projetos Local no Estilo Trello para Agentes OpenClaw

Teste de LLMs locais para geração autônoma de código: Benchmark de qualidade versus velocidade

htmLLM-124M v2 Lançado: Modelo Especializado de Autocompletar HTML/Bootstrap