Outil Local d'Analyse d'Images par IA Utilise des Modèles de Vision Ollama pour les Retours

Un développeur a publié une application de bureau gratuite qui fournit une critique d'images IA en utilisant des modèles de vision locaux via Ollama. L'outil analyse les images générées par IA et génère des rapports de retour structurés sans nécessiter de services cloud.
Fonctionnalités principales
- Fonctionne à 100% localement en utilisant les modèles de vision Ollama
- Utilise llama3.2-vision par défaut, mais peut être basculé vers d'autres modèles de vision
- Génère des rapports clairs avec des sections spécifiques
- Fonctionne avec les générations de style anime Flux/SD3 et les images photoréalistes
Structure du rapport
- Ce qui est réussi - Aspects positifs de l'image
- Ce qui pourrait être amélioré - Domaines nécessitant des améliorations
- Scores rapides - Évaluations pour l'Anatomie, l'Harmonie des couleurs et l'Ambiance
- Note globale - Avec le raisonnement derrière l'évaluation
- Suggestion d'amélioration du prompt - Phrases spécifiques à ajouter aux prompts pour de meilleures générations suivantes
Prérequis
L'outil nécessite qu'Ollama soit déjà installé et qu'un modèle de vision soit téléchargé. Le développeur note que si vous n'avez pas configuré Ollama, cet outil ne vous convient pas.
État actuel et demande de retours
Le développeur a partagé des captures d'écran de l'interface de l'application et deux exemples d'analyses. Il sollicite les retours des utilisateurs qui travaillent réellement avec des modèles de vision, demandant quelles fonctionnalités supplémentaires seraient utiles. Les améliorations potentielles mentionnées incluent davantage de catégories de scores, des capacités de traitement par lots et différentes options de focalisation.
📖 Read the full source: r/LocalLLaMA
👀 See Also

Skill Seekers v3.2.0 ajoute l'extraction de tutoriels YouTube pour les compétences Claude.
Skill Seekers v3.2.0 extrait désormais le contenu des tutoriels YouTube pour créer des fichiers SKILL.md structurés pour Claude. L'outil utilise un flux de travail d'amélioration par IA en deux passes pour nettoyer la sortie OCR et générer une documentation utilisable à partir du contenu vidéo.

Deux compétences gratuites de Claude Code : Générateur de tutoriels et Correcteur de prompts
Deux nouvelles compétences Claude Code gratuites : create-tutorial génère des tutoriels de lecture de code à partir de vos fichiers de projet réels, et prompter reformule les invites remplies de fautes de frappe en instructions actionnables. Les deux sont sous licence MIT et s'installent via GitHub.

Carte Mentale Interactive Visualise l'Écosystème d'Outils Claude
Un développeur a créé une carte mentale HTML interactive avec D3.js pour suivre les fonctionnalités des outils Claude Chat, Cowork et Code, incluant la disponibilité des plateformes, les différences de tarification et la compatibilité des connecteurs.

Navigateur39 : Un navigateur Web sans tête pour les agents d'IA
Browser39 est un navigateur web sans interface conçu spécifiquement pour les agents d'IA qui convertit les pages web en Markdown optimisé pour les tokens localement, exécute JavaScript, gère les cookies et les sessions, interroge le DOM et remplit les formulaires. C'est un binaire unique sans navigateur externe nécessaire, sans frais et sans service externe.