O Skill Seekers v3.2.0 adiciona extração de tutoriais do YouTube para habilidades do Claude.

O Skill Seekers v3.2.0 adiciona capacidades de extração de vídeo a esta ferramenta de código aberto que converte documentação em habilidades para o Claude. Agora você pode apontá-la para um tutorial do YouTube e obter um arquivo SKILL.md estruturado que o Claude pode usar como contexto persistente.
Como funciona
O comando básico é:
skill-seekers video --url https://youtube.com/watch?v=... --enhance-level 2
O pipeline inclui:
- Extração de transcrição usando YouTube API → yt-dlp → Whisper como fallback
- Extração e classificação de quadros-chave (editor de código, terminal, slides, webcam)
- OCR em painéis de código com conjunto multi-engine
- Acompanhamento da evolução do código entre quadros (quais linhas foram adicionadas/alteradas/removidas)
- Aprimoramento de IA em duas etapas para limpeza
Fluxo de trabalho de aprimoramento de IA em duas etapas
A Etapa 1 envia o arquivo de referência bruto (OCR ruidoso + transcrição) para o Claude e pede que ele reconstrua a Linha do Tempo do Código. Isso corrige erros de OCR como l/1 e O/0, remove lixo de interface que vazou (painéis do Inspector, barras de abas) e usa a narração da transcrição como contexto para o que o código deveria ser.
A Etapa 2 pega a referência limpa e gera o SKILL.md final — um documento estruturado com etapas de configuração, exemplos de código e conceitos extraídos do tutorial.
Você pode definir fluxos de trabalho de aprimoramento personalizados em YAML:
stages:
- name: ocr_code_cleanup
prompt: "Limpe artefatos OCR dos blocos de código..."
- name: tutorial_synthesis
prompt: "Sintetize uma narrativa de ensino..."
Insights técnicos do desenvolvimento
- OCR em editores de código é surpreendentemente difícil devido a decorações da IDE (números de linha, marcadores de recolhimento, barras de abas) vazando no texto
- A classificação de quadros importa — quadros de webcam produzem puro lixo quando submetidos a OCR; ignorá-los reduziu a saída de lixo em ~40%
- A abordagem em duas etapas foi um grande salto de qualidade, permitindo que o Claude veja tanto o contexto OCR quanto da transcrição para reconstruir código danificado
Outras fontes suportadas
- Sites de documentação (presets para React, Vue, Django, FastAPI, Godot, Kubernetes e mais)
- Repositórios do GitHub (análise AST, detecção de padrões)
- PDFs e documentos do Word
- Saídas para Claude, Gemini, OpenAI ou formatos RAG (LangChain, Pinecone, ChromaDB, etc.)
Instalação e configuração
Instale com: pip install skill-seekers
Dependências de vídeo precisam de configuração de GPU: skill-seekers video --setup (detecta automaticamente CUDA/ROCm/CPU)
📖 Leia o código-fonte completo: r/ClaudeAI
👀 See Also

yburn: Ferramenta para auditar e substituir tarefas cron desnecessárias de agentes de IA
yburn é uma ferramenta Python que audita tarefas cron de agentes de IA e substitui aquelas que não precisam de LLMs por scripts Python independentes. O criador descobriu que 58% de 98 tarefas cron eram tarefas puramente mecânicas, como verificações de saúde do sistema e backups do git.

Gerenciador de Projetos Local no Estilo Trello para Agentes OpenClaw
Um desenvolvedor construiu uma ferramenta local de gerenciamento de projetos semelhante ao Trello que roda na mesma máquina que seu agente OpenClaw, armazenando cartões como arquivos markdown com frontmatter YAML. O sistema usa Node.js/Express para a API, React para a interface e permite que o agente de IA leia/escreva arquivos diretamente no sistema de arquivos.

Teste de LLMs locais para geração autônoma de código: Benchmark de qualidade versus velocidade
Um desenvolvedor criou uma estrutura de teste para avaliar LLMs locais em tarefas reais de geração de código Go, medindo sucesso de compilação, precisão na extração de campos e taxa de transferência. Os resultados comparam modelos em termos de qualidade e velocidade.

htmLLM-124M v2 Lançado: Modelo Especializado de Autocompletar HTML/Bootstrap
A LH-Tech-AI lançou o htmLLM-124M v2, um modelo de 124 milhões de parâmetros especializado em autocompletar HTML/Bootstrap que alcança 0.91 de perda de validação e treina em ~8 horas em uma única GPU T4.