Cull : Moteur de curation de jeux de données open source pour les pipelines d'images IA

✍️ OpenClawRadar📅 Publié: May 10, 2026🔗 Source
Cull : Moteur de curation de jeux de données open source pour les pipelines d'images IA
Ad

Cull est un moteur de curation automatique pour les ensembles de données d'images IA, créé et maintenu par u/Compunerd3. Il automatise l'ensemble du pipeline : scraping, classification, légendage et tri — produisant un dossier d'images triées avec des prompts SD prêts pour l'entraînement LoRA ou le fine-tuning.

Pipeline de bout en bout

  • Scraping : Prend en charge Civitai (.com et .red), X/Twitter, Reddit, Discord et toute URL que gallery-dl supporte — Pixiv, DeviantArt, famille booru, ArtStation, Tumblr, FurAffinity/e621, Imgur, Flickr et environ 340 autres.
  • File d'attente : Chaque image + prompt source est placé dans une file d'attente locale. Déduplication par source, sans base de données.
  • Classification : Utilise un modèle vision-langage via plusieurs instances LM Studio (local) ou Groq (cloud) — tout endpoint compatible OpenAI. Un schéma JSON strict à 17 champs garantit une sortie structurée.
  • Tri : Les images conservées vont dans des dossiers de catégories avec un fichier .txt de prompt et un enregistrement d'audit .vision.json. Deux seuils de score (qualité + pertinence thématique) réglables dans l'interface.
  • Tableau de bord : Interface Flask + Alpine.js avec démarrage/arrêt, activation des sources, galerie, éditeur de prompts, export ZIP et statistiques par source.

Cas d'utilisation

L'auteur a utilisé Cull pour un LoRA de 300 images et un ensemble de fine-tuning de 100 000 images. Définissez un sujet (par exemple « Femme influenceuse » ou {style artiste}), activez AUTO_CAPTION_ENABLED, et laissez faire. Pour les archives sans prompts, pointez LOCAL_IMPORT_DIR vers un dossier de JPEG, désactivez l'exigence de prompt, et activez le légendage automatique — chaque image reçoit un prompt SD, des tags booru ou une légende en langage naturel.

Ad

Détails techniques

  • Worker vision interchangeable : Sous-classez BaseVisionWorker, enregistrez-le. Deux endpoints LM Studio tournent en parallèle ; un worker keepalive ping toutes les 15s pour éviter le déchargement inactif ; déchargeur inactif optionnel pour libérer la VRAM.
  • Intégration assistant IA : Livré avec un bundle de compétences Claude Code dans .claude/skills/ (cull-helper, lmstudio-vision, metadata-schema) et trois sous-agents — fonctionne avec Claude Code, Cursor, Aider, Codex.
  • Auto-mise à jour : Toast dans le tableau de bord, cliquez sur Mettre à jour, tire depuis origin/main et relance.
  • Stack : Python 3.10+, Flask, Alpine.js, Pillow, Playwright (scraper X), gallery-dl. Machine unique, pas de Redis, pas de base de données, pas de Docker.
  • Licence : MIT.

Feuille de route

Prévu : plus de backends de workers vision, amélioration de l'interface de remise en file d'attente, petit CLI sans tête, scraping et classification de vidéos.

Dépôt : https://github.com/tlennon-ie/cull | Captures d'écran : https://imgur.com/a/kSvsAW9

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Dirac : un agent open-source domine TerminalBench avec 65,2 %, moins cher et ouvert
Tools

Dirac : un agent open-source domine TerminalBench avec 65,2 %, moins cher et ouvert

Dirac, un agent de codage open-source, a obtenu un score de 65,2 % sur TerminalBench 2.0 pour gemini-3-flash-preview, surpassant le socle de Google (47,6 %) et le meilleur agent propriétaire Junie CLI (64,3 %). Il réduit également les coûts API de 64,8 % par rapport à ses concurrents.

OpenClawRadar
Résultats de Référence pour les Modèles Locaux de Petite Taille et les Modèles OpenRouter sur la Tâche Agentique de Text-to-SQL
Tools

Résultats de Référence pour les Modèles Locaux de Petite Taille et les Modèles OpenRouter sur la Tâche Agentique de Text-to-SQL

Un développeur a testé plusieurs petits modèles locaux et OpenRouter en utilisant un benchmark agentique personnalisé de conversion de texte en SQL qui transforme des requêtes en anglais en SQL avec des cycles de débogage. Le benchmark comprend 25 questions, s'exécute en moins de 5 minutes, et révèle les meilleurs modèles comme kimi-k2.5 et les variantes de Qwen 3.5.

OpenClawRadar
Pilote : Un outil d'automatisation de navigateur entièrement construit avec du code Claude
Tools

Pilote : Un outil d'automatisation de navigateur entièrement construit avec du code Claude

Un non-développeur a utilisé Claude Code pour créer Pilot, un outil d'automatisation Chrome qui permet à l'IA de contrôler les navigateurs via la navigation dans l'arbre d'accessibilité. L'outil attribue des numéros aux éléments cliquables pour que Claude puisse donner des commandes comme 'cliquer 5' au lieu de deviner les positions à l'écran.

OpenClawRadar
Snip : L'outil open source réduit l'utilisation de tokens de code Claude avec des filtres YAML
Tools

Snip : L'outil open source réduit l'utilisation de tokens de code Claude avec des filtres YAML

Snip est un outil basé sur Go qui se place entre Claude Code et le shell, filtrant la sortie verbeuse des commandes via des pipelines YAML déclaratifs pour réduire l'utilisation de tokens de 60 à 90 %. Il comprend 16 actions de pipeline composables et fonctionne avec plusieurs agents d'IA de codage.

OpenClawRadar