KI-Bildkritik-Tool: Ollama Vision lokal nutzen

Ein Entwickler hat eine kostenlose Desktop-Anwendung veröffentlicht, die KI-Bildkritik mit lokalen Vision-Modellen über Ollama bietet. Das Tool analysiert KI-generierte Bilder und erstellt strukturierte Feedback-Berichte, ohne Cloud-Dienste zu benötigen.

Hauptfunktionen

Läuft zu 100 % lokal mit Ollama-Vision-Modellen
Verwendet standardmäßig llama3.2-vision, kann aber auf andere Vision-Modelle umgestellt werden
Erstellt übersichtliche Berichte mit spezifischen Abschnitten
Funktioniert sowohl mit Flux/SD3 Anime-Stil-Generierungen als auch mit fotorealistischen Bildern

Berichtsstruktur

Was gut aussieht - Positive Aspekte des Bildes
Was verbessert werden könnte - Bereiche, die Verbesserung benötigen
Schnellbewertungen - Bewertungen für Anatomie, Farbharmonie und Stimmung
Gesamtbewertung - Mit Begründung für die Einschätzung
Prompt-Optimierungsvorschlag - Spezifische Formulierungen, die zu Prompts hinzugefügt werden können, um bessere nächste Generationen zu erhalten

Anforderungen

Das Tool erfordert, dass Ollama bereits installiert ist und ein Vision-Modell geladen wurde. Der Entwickler weist darauf hin, dass dieses Tool nicht für Sie geeignet ist, wenn Sie Ollama nicht eingerichtet haben.

Aktueller Status und Feedback-Anfrage

Der Entwickler hat Screenshots der Anwendungsoberfläche und zwei Beispielanalysen geteilt. Er sucht Feedback von Nutzern, die tatsächlich mit Vision-Modellen arbeiten, und fragt, welche zusätzlichen Funktionen nützlich wären. Genannte mögliche Verbesserungen umfassen mehr Bewertungskategorien, Stapelverarbeitungsfähigkeiten und verschiedene Fokusoptionen.

📖 Read the full source: r/LocalLLaMA

Lokales KI-Bildkritik-Tool nutzt Ollama Vision-Modelle für Feedback

Hauptfunktionen

Berichtsstruktur

Anforderungen

Aktueller Status und Feedback-Anfrage

👀 Siehe auch

Verwendung von Claude zur Automatisierung der Mobile-App-QA mit Capacitor WebViews

Cocall.ai MCP: Ausgehende Telefonanrufe mit Echtzeit-Mensch-Eskalation

Lore: MCP-Server, der KI-Agenten-Sitzungsverlauf zwischen Tools teilt

Deblank: Tool zur Entfernung von Code-Formatierung für LLM-Token-Reduzierung