Skill Seekers v3.2.0 : extrait tutoriels YouTube pour Claude

Skill Seekers v3.2.0 ajoute des capacités d'extraction vidéo à cet outil open-source qui convertit la documentation en compétences pour Claude. Vous pouvez désormais le pointer vers un tutoriel YouTube et obtenir un fichier SKILL.md structuré que Claude peut utiliser comme contexte persistant.

Fonctionnement

La commande de base est :

skill-seekers video --url https://youtube.com/watch?v=... --enhance-level 2

Le pipeline comprend :

Extraction de transcription via l'API YouTube → yt-dlp → Whisper en secours
Extraction et classification d'images clés (éditeur de code, terminal, diapositives, webcam)
OCR sur les panneaux de code avec un ensemble multi-moteurs
Suivi de l'évolution du code entre les images (quelles lignes ont été ajoutées/modifiées/supprimées)
Amélioration par IA en deux passes pour le nettoyage

Flux de travail d'amélioration par IA en deux passes

La passe 1 envoie le fichier de référence brut (OCR bruité + transcription) à Claude et lui demande de reconstruire la chronologie du code. Cela corrige les erreurs OCR comme l/1 et O/0, supprime les éléments d'interface indésirables qui se sont glissés (panneaux d'inspection, barres d'onglets), et utilise la narration de la transcription comme contexte pour ce que le code devrait être.

La passe 2 prend la référence nettoyée et génère le SKILL.md final — un document structuré avec des étapes de configuration, des exemples de code et des concepts extraits du tutoriel.

Vous pouvez définir des flux de travail d'amélioration personnalisés en YAML :

stages:
  - name: ocr_code_cleanup
    prompt: "Nettoyer les artefacts OCR des blocs de code..."
  - name: tutorial_synthesis
    prompt: "Synthétiser un récit pédagogique..."

Perspectives techniques issues du développement

L'OCR sur les éditeurs de code est étonnamment difficile à cause des éléments décoratifs de l'IDE (numéros de ligne, marqueurs de réduction, barres d'onglets) qui s'infiltrent dans le texte
La classification des images est importante — les images de webcam produisent des déchets purs lors de l'OCR ; les ignorer a réduit la sortie indésirable d'environ 40 %
L'approche en deux passes a été un grand bond en qualité, permettant à Claude de voir à la fois le contexte OCR et de la transcription pour reconstruire le code altéré

Autres sources prises en charge

Sites web de documentation (préréglages pour React, Vue, Django, FastAPI, Godot, Kubernetes, et plus)
Dépôts GitHub (analyse AST, détection de motifs)
PDF et documents Word
Sorties pour Claude, Gemini, OpenAI, ou formats RAG (LangChain, Pinecone, ChromaDB, etc.)

Installation et configuration

Installez avec : pip install skill-seekers

Les dépendances vidéo nécessitent une configuration GPU : skill-seekers video --setup (détection automatique CUDA/ROCm/CPU)

📖 Lire la source complète : r/ClaudeAI

Skill Seekers v3.2.0 ajoute l'extraction de tutoriels YouTube pour les compétences Claude.

Fonctionnement

Flux de travail d'amélioration par IA en deux passes

Perspectives techniques issues du développement

Autres sources prises en charge

Installation et configuration

👀 See Also

Jeu de Puzzle pour Bots avec Prix : Un Nouveau Défi pour les Codeurs d'IA

Détection des défaillances silencieuses des outils dans les agents de codage IA avec Vibeyard

Compétences de Claude pour Émuler un Environnement de Studio de Design

Claude crée une application d'analyse immobilière en 3 heures avec des données Zillow en direct via clawhub